index inteligent a la gugăl

Google îmi frunzărește zilnic blogul și îl indexează aproape temeinic – mă rog, așa cum l-au învățat programatorii lor. Din cauza secretomaniei care înconjoară algoritmii care acordă importanță conținutului și plasează pagina mai sus sau mai jos în căutări, mulți au impresia că în adîncurile planetei niște hipercalculatoare super-ultra-mega-inteligente analizează și cîntăresc bine greutatea fiecărui cuvînt pentru a da rezultate cît mai relevante la căutări.

Aiurea! Hiper-super-ultra-mega or fi calculatoarele lor dar inteligența care le mînă e praf. E vorba de multă forță brută care încearcă cu disperare să compenseze prostia autorilor algoritmilor care chinuiesc bietele servere Google.

Google are o armată de oameni dedicați limbii Române, dovadă stau atîtea pagini traduse destul de rezonabil în medie. Cînd vine vorba de căutări în limba română, e greu de crezut că se poate mai prost. Pînă acum nu eram conștient de cît de slabi pot fi algoritmii “de vis” ai căutătorilor planetari. Avînd în vedere că îmi cunosc în general blogul și îmi dau seama ce conține, pot să-mi fac o imagine despre cuvintele cheie pe care le-aș sublinia dacă ar fi să-mi doresc să găsesc paginile din el. Google, în mărinimia lor, m-au lăsat și pe mine să aflu care li se par lor cele mai relevante, particulare și interesante cuvinte din cele 119 pagini pe care le-au indexat în acest moment. Vă las să savurați prostia algoritmizată în sinteză – lista cu cele mai importante și relevante cuvinte din blog așa cum o vede Google:

keywords 

Dacă ar fi să elimin pozițiile 7 (mrx) și poate cu greu 10 (zic), restul de “cele mai relevante” 8 cuvinte din blog sînt toate cuvinte care ar trebui IGNORATE în indexări, cuvinte cu pondere nulă într-o eventuală analiză a conținutului (sigur Google nu se uită la nuanțele textului ca să-i fie necesare). Cred că sînt foarte sus pe lista atunci cînd oamenii caută “și, să, în, că, care, din, așa” (pardon de succesiunea “că, care”
– așa le-a ordonat motoru’). Se vede treaba că ar trebui să regîndesc complet modul meu de exprimare și să acord mai multă pondere subiectelor și predicatelor, evitînd riguros cuvintele de legătură.

Pentru azi ai nota “vai-și-amar” domnule programator de la Google. Stai jos!

Ah – și dacă mă bagi prin vreun blacklist pentru că am fost rău cu tine și nu mă mai indexezi deloc, cu așa cuvinte relevante cum ai găsit nici nu cred că ar fi vreo pagubă.

PS: încep să fiu mai liniștit și în privința informațiilor cu caracter personal pe care le adună cu atîta disperare Google. Cu așa algoritmi e greu de crezut că vor găsi ceva relevant despre mine chiar dacă le-aș trimite biografia secretă în format XML. Problema rămîne că stochează totul și poate pînă la urmă reușesc să angajeze pe cineva care să dea și sens harababurii. Le urez ca asta să se întîmple atunci cînd informațiile personale vor mai avea doar un eventual interes istoric.

3 thoughts on “index inteligent a la gugăl”

  1. Am cautat si eu cu google dupa „și să în că care din așa” ca poate poate ma duce direct la blogul curent.

    dintre rezultatele remarcabile citez:
    Si caii se impusca, nu-i asa? (1994)
    nicu paleru si r juve las o asa free Mp3 Download
    nicolae guta si sandu ciorba stati asa dusmanii mei 2010 album …

    deci e chiar de risul lumii ce a facut google indexind cuvintele de legatura

  2. Sincer sper ca entry-ul asta din blog sa ajunga sa-l vada boii de la google Romania.
    Banuiesc ca au salarii competitive si diplome.
    A testat cineva chestia asta pe la voi?
    Jalnic….

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *