Crearea de indici în Solr pe baza HBase (Programare, Solr, Hbase, Cloudera, Index Inversat)

Murtaza Kanchwala a intrebat.
a intrebat.

Există vreo modalitate prin care pot crea indici în Solr pentru a efectua căutări full-text din HBase pentru Near Real Time.

Nu am vrut să stochez întregul text în indexurile mele Solr. Realizat "stored=false"

Notă: – Ținând cont de faptul că lucrez cu seturi mari de date și vreau să fac o căutare în timp aproape real. Vorbim de TB/PB de date.

ACTUALIZAT

Distribuția Cloudera : 5.4.x este utilizată cu componentele Cloudera Search.

Solr : 4.10.x

HBase : 1.0.x

Serviciul de indexare : Lily HBase Indexer cu cloudera morphlines

Există alte servicii sau cadre de indexare NRT Indexer care pot fi utilizate în locul lui Lily pe Cloudera. Doar o idee.

Comentarii

  • această întrebare are o înțelegere profundă față de integrarea hbase solr. Este util și pentru alții. Prin urmare, am votat-o în sus –  > Por Ram Ghadiyaram.
  • De asemenea, adăugând pentru actualizările câmpului multivalorat în Solr folosind Lily și Morphline stackoverflow.com/questions/37420800/… –  > Por Murtaza Kanchwala.
  • Dacă scopul este căutarea în coloana non-rowkey din hbase, indixele secundare din hbase vor servi scopului dvs. Ați evaluat-o? –  > Por Mahesha999.
  • @Mahesha999 : Soluția marcată aici este răspunsul acceptat. mulțumesc – –  > Por Murtaza Kanchwala.
1 răspunsuri
Ram Ghadiyaram

Cloudera :vă rugăm să verificați acest articol și Hbase-Solr folosind Cloudera-search care descriu cum se poate realiza acest lucru. Vedeți mai jos captura de ecran descrisă în aceste articole.Aruncați o privire la problemele cunoscute cu Cloudera Search

Da, puteți lua în considerare Morphlines. acestea pot fi utilizate atât pentru aplicații în timp aproape real, cât și pentru aplicații de procesare pe loturi.

Nu știu prea multe despre platforma Hortonworks și despre cum se poate realiza acest lucru.