24/04/2017 di Redazione

Jobrapido è ancor più rapido con Hadoop e Cloudera

Il motore di ricerca dedicato agli annunci di lavoro utilizza la tecnologia Hadoop, nella distribuzione commerciale di Cloudera per analizzare in tempo reale una media di 50 GB di dati giornalieri. Ha così guadagnato velocità e migliorato il servizio.

immagine.jpg

Gli analytics che incrociano la logica open source con la tecnologia proprietaria di un fornitore sono la strada imboccata da Jobrapido, il motore di ricerca per il recruiting più utilizzato in Italia e non solo. Fondata nel 2006, l'azienda milanese oggi è presente con il proprio motore di ricerca per il recruiting in 58 Paesi e conta 70 milioni di iscritti e 35 milioni di utenti unici mensili. La mole di dati, strutturati e non, processati quotidianamente è notevole: in media, 50 GB al giorno.

Per incrociare al meglio domanda e offerta e per ottimizzare la presentazione dei contenuti sul sito in base al singolo navigante, la società si affida, naturalmente, agli analytics. Oggi, con una tecnologia diversa rispetto a quella impiegata in passato: due anni fa si è deciso di migrare sulla piattaforma open source Hadoop. “In Jobrapido i dati sono considerati un asset strategico”, ha commentato il direttore Business Intelligence, Raffaele Serrecchia, “e cerchiamo quindi di sfruttare al meglio tutto il potenziale che offrono, concentrando sforzi, competenze e investimenti in tal senso, soprattutto in un’ottica di formazione delle persone che si occupano di Business Intelligence e data warehouse”.

Restava da scegliere la soluzione tecnologica che materialmente si occupasse di memorizzare e analizzare il mare quotidiano di informazioni ovvero, in altre parole, la specifica distribuzione commerciale di Hadoop. L'esperienza individuale di un ingegnere del dipartimento ricerca&sviluppo ha indirizzato l'azienda su Cloudera, vendor peraltro già noto ad alcuni progettisti di Jobrapido. In seguito alla realizzazione di alcuni proof-of-concept, risultati sempre più apprezzati da vari dipartimenti, la soluzione è stata poi estesa a tutte le attività di data warehouse (conservazione dei dati) e di Business Intelligence (analisi mirata alla scoperta di correlazioni e indicazioni strategiche).

Con la soluzione Data Lake sviluppata insieme a Cloudera, Jobrapido è in grado di memorizzare sull'Hadoop Distributed File System sia dati strutturati che sia strutturati, provenienti per esempio dai sondaggi o dai curricula e da altri documenti. Può, inoltre, interrogare una mole di circa 50GB di dati al giorno in modo più efficace rispetto al passato. Lo strumento Cloudera Manager permette di monitorare in modo automatizzato un intero cluster di dati.

Grazie a questo progetto il motore di ricerca ha potuto beneficiare di due miglioramenti operativi: la possibilità di arricchire eventi e definire nuovi tracciamenti in tempi molto più brevi che in precedenza e quella di costruire strutture di reporting ricalcolabili in minor tempo rispetto al passato. In sintesi, il progetto ha consentito a Jobrapido di interrogare i dati in modo più efficace, migliorando così il servizio: può ora proporre alle aziende che pubblicano inserzioni candidati più qualificati, e può farlo in tempi più rapidi. Tra i riscontri tangibili, sono aumentati sia la marginalità Sem (Search Engine Marketing) sia il numero di conversioni sul sito Web, grazie alla possibilità fornita da Cloudera di arricchire con maggiori dettagli gli eventi tracciati sul portale.

 

ARTICOLI CORRELATI