
Tegenwoordig ga ik naar Google om te controleren of een woord correct gespeld is. Heel vaak vind je een aantal vermeldingen laag bij het fout gespelde woord en hoog bij het correct gespelde woord.
Google kun je ook gebruiken hoe populair bepaalde zoekwoorden zijn. Daarvoor hebben zij een apart keywoord tool ontwikkeld. Ik ben gaan onderzoeken hoeveel keer naar de populaire ETL Tools gezocht is. Naar de volgende ETL tools heb ik gezocht:
De onbetwiste marktleiders zijn Microsoft, IBM en Oracle met respectievelijk SQL Server Integration Services (SSIS), Datastage en Oracle warehouse builder (OWB).
De open source ETL tool Pentaho is een goede vierde.
Dit is de grafiek van de top 10 ETL Tools (de overige ETL-Tools hebben minder dan 1% populariteitsaandeel):
De cijfers zien er als volgt uit:
| ETL Tool | Wereldwijde maandelijkse zoekopdrachten | Populariteitsaandeel |
| SQL server integration services (SSIS) | 42.280 | 36% |
| Datastage (IBM) | 18.830 | 16% |
| Oracle warehouse builder (OWB) | 12.890 | 11% |
| Pentaho | 12.240 | 11% |
| Pervasive data integrator | 6.260 | 5% |
| Powercenter ETL | 4.640 | 4% |
| Talend ETL | 4.310 | 4% |
| Data Manager/Decision Stream (Cognos-IBM) | 3.562 | 3% |
| Altova mapforce | 2.810 | 2% |
| Business object data integrator (BODI) | 2.750 | 2% |
| SAS data integration | 1.440 | 1% |
| Clover ETL | 1.310 | 1% |
| Ab initio | 1.140 | 1% |
| IBM Information Server | 632 | 1% |
| Jaspersoft ETL | 590 | 1% |
| Data Migrator | 91 | 0% |
| Elixir Repertoire | 73 | 0% |
| Open Text Integration Center | 36 | 0% |
| Dataflow Manager | 16 | 0% |
| DB2 Warehouse Edition | 16 | 0% |
| Totaal | 115.916 |
Aanvulling 4-4-2011:
Jaspersoft ETL gebruikt tegenwoordig Talend ETL als basis voor hun Suite. Jaspersoft is een open source reporting tool.
Naar aanleding van de vraag van Kasper de Graaf over de populariteit van SSIS hieronder de verantwoording van de keyword populariteit:
| Zoekwoord | Wereldwijde maandelijkse zoekopdrachten |
| ssis | 33100 |
| sql server integration services | 2900 |
| sql ssis | 880 |
| ssis packages | 720 |
| ssis sql | 480 |
| ssis training | 480 |
| sql server integration services tutorial | 390 |
| ssis script component | 390 |
| sql server etl | 320 |
| sql server online | 320 |
| sql server integration service | 260 |
| script component ssis | 210 |
| ssis transformations | 170 |
| sql server 2005 software | 140 |
| ssis components | 140 |
| ssis lookup transformation | 140 |
Beste Frank,
Mooi overzicht, opvallend dat Microsoft SSIS hier zo enorm uitspringt, dit lijkt mij in tegenspraak met de installed base van ETL tools, ik zou dan Informatica, en OWB hoog inschatten. Heb jij hier een mogelijke verklaring voor?
Kasper de Graaf
Hallo Kasper,
In de grafiek geef ik weer wat de google keyword tool weergeeft qua populariteit, zonder dat ik daar een waarde oordeel over geef.
Persoonlijk vind ik de populariteit van Microsoft SSIS niet gek. Je krijgt het eigenlijk “gratis” bij Microsoft SQL server, en daar zijn er natuurlijk heel veel van verkocht. Ik denk dat er veel meer mensen met etl achtige processen bezig zijn dan waar wij in eerste instantie aan denken.
Ik heb de blog aangepast met de verantwoording van de zoekresultaten die ik heb meegenomen in de populariteitsscore.
Hi Frank!
leuke post
)
kun je iets meer zeggen over de methode die je hebt gebruikt? Welke google tool bedoel je bijvoorbeeld?
Als ik bij google search insights kijk, dan krijg ik een iets ander beeld: informatica staat dan juist bovenaan, gevolgd door oracle.
http://www.google.com/insights/search/#q=%22etl+tools%22&cmpt=q
Overigens lijkt het me moeilijk om aan het searchvolume alleen een conclusie te verbinden. Bijvoorbeeld: “Wat is SSIS” van alle gebruikers die toevallig een MS SQL instance hebben, kan toch moeilijk worden opgevat als een indicatie van de polulariteit van de tool an sich, hoogstens van de install base.
Roland,
Dank voor je reactie. De tool die ik gebruikt heb staat hier Dit is de tool van Google om het zoekverkeer te schatten op zoekwoorden en is ook nog een keer context gevoelig. Voor het onderzoek naar de populariteit heb ik de namen van alle etl tools die mij bekend zijn ingevoerd in dit systeem. Dat waren er 20. Google komt dan terug met een lijst van 800 zoektermen die mensen intypen, die betrekking hebben op die zoekwoorden. Daarna is het een inschatting maken van wat wel en niet relevant is, optellen en er een grafiek van maken. De conclusie die je er aan verbindt is een persoonlijke. Ik heb het onderzoek “populariteit” genoemd, omdat het aangeeft hoe vaak er naar gezocht wordt zonder daar een waardeoordeel aan te willen geven. Het geeft een indicatie en volgens mij nog een goede ook. Als er 40.000 keer naar iets gezocht wordt op maandbasis of 400 keer geeft toch een indicatie dat er een verhouding is van 100 op 1. Marktaandeel? Concurrentieaandeel? Zonder naar Gartner te hoeven gaan om een indicatie te krijgen hoe vaak mensen over een onderwerp iets willen weten, is al veel waard wat mij betreft. Wat mij persoonlijk verbaasde was dat datastage van IBM zo hoog scoorde. Zo krijg je toch een beeld hoe de wereld er in de realiteit uitziet. En we mogen Google dankbaar zijn dat miljarden zoektermen gratis voor onderzoek beschikbaar zijn (hoewel het een toepassing is waar google hem natuurlijk niet voor heeft opgezet).
Frank,
Ik ben er nog niet van overtuigd dat je zoekvolume kunt gelijstellen aan populariteit, maar die adwords tool is wel een hele interessante. Dank, goeie tip!!
Roland,
Tot je dienst! Zelf ben ik mij door dit onderzoek meer in SSIS, SSAS en SSRS aan het verdiepen…
[...] mijn eigen onderzoek naar de populariteit van ETL Tools (zie hier), ben ik mij gaan verdiepen in de Business Intelligence Suite van Microsoft Server [...]