Archive for the ‘Tips and tricks’ Category
9Nov De la ruşi vine… sphinx-ul Software, Tips and tricks
Chiar daca mulţi se irită când vine vorba de ruşi (inclusiv cârmaciul nostru), nimeni nu poate nega aportul mare pe care l-au avut ruşii la cultura şi progresul modial. Până şi Google e pe jumăte rusesc. Da, sunt uneori aroganţi dar vi se pare diferit de cum sunt americanii? Asta e…, privilegiul unei naţiuni puternice.
Dar să lăsăm politica, astăzi vreau să vorbesc despre o chestie cu care fiecare din noi (programatorii) s-a întâlnit cel puţin o dată şi anume căutarile, fie ele în baze de date sau în fişiere. Nu vorbesc de chestii ca “toate produsele cu preţul > 10″, ci căutari “google style”. Totul e bine şi frumos cât timp căutam în câteva zeci/sute de înregistări, good old LIKE “%find me%” se descurcă, putem chiar ignora faptul că folosirea “%” la începutul string-ului forţează mysql să nu mai folosească indecşii. Cum trecem de bariera 1000 şi mai avem şi puţin trafic pe site încep problemele. 1000 însă e un număr mic şi MySql are soluţia, şi îi zice MATCH AGAINST (Full-Text Search). Dar ce facem când avem de căutat într-o bază de date de sute de mii sau chiar milioane de înregistrări? Sunt rare aplicaţiile care lucrează cu un aşa volum de date, dar există.
Salvarea vine de la Sphinx, o aplicaţie free distribuită sub licenta GPL v2. Ştiam de ceva timp despre ea, dar nu am făcut teste până de curând (da, picau serverele într-o veselie). Aplicaţia poate fi compilată şi rulată pe:
- Linux 2.4.x, 2.6.x
- Windows 2000, XP
- FreeBSD 4.x, 5.x, 6.x
- NetBSD 1.6
- Solaris 9
Eu am testat numai pe un RHEL şi instalarea a fost un banal configure;make;make install;. Configurarea de asemenea este simplă şi constă în editarea unui fişier care e foarte bine comentat. Este evident că acest program a fost scris să se integreze uşor cu MySql-ul. Indexarea unei baze de date de 5 GB cu peste 1 mln de înregistrări a durat mai puţin de 20 min (ceea ce e foarte rapid). Şi acum momentul adevărului, ţineţi-vă bine, o căutare durează în medie 0.1 s. E primul soft din ultimii caţiva ani care m-a uimit.
Deşi cel mai uşor este să indexezi baze de date, e destul de simplu să indexezi orice folosind o interfaţă XML. O altă chestie tare e că toată povestea aceasta poate fi uşor scalată folosind căutările distribuite ceea ce permite un volum extrem de mare de cautări concomitente pe seturi de date imense.
Ultima etapă a fost conectarea la Sphinx din php care graţie unui client bine scris (şi prin client să înţelegeţi o clasă php care nu are nevoie de module adiţionale) s-a rezumat la câteva rânduri.
În concluzie, dacă aveţi de facut căutări full-text în seturi mari de date, nu aveţi nevoie de zeci de servere şi softuri de mii de dolari, aveţi nevoie doar de câteva ore ca să faceţi un micuţ google pentru miile de documente/fişiere interne ale firmei.
3 Comments » 13Sep Browsing la locul de munca? Tips and tricks
Azi mi-am aminte de o stire pe care o citisem in urma cu vreo 2 zile pe bit-tech.net, un site englezesc care se axeaza mai mult pe hardware si gaming, dar care are de multe ori stiri interesante si articole foarte bine scrise. Stirea era despre proxy-uri si despre numarul mare de firme ce blocheaza accesul angajatilor la site-uri gen youtube.
Interesant e faptul ca nu e singura stire de gen, in ultimul timp pe site-urile din afara vad ca se vorbeste tot mai mult pe aceasta tema, dar cautand azi articolul din nou am observat ca nu mai e pe site. O cautare rapida pe google si am gasit stirea in cache, dar url-ul evident nu mai este functional, semn ca redactorii au fost obligati sa dea jos stirea. Noroc cu Google cache.
Stirea oferea o lista de proxy-uri care permit browsing-ul pe site-urile blocate, iar unul dintre ele, Ultimate Unblock, permite browsing-ul pe site-uri ce contin flash, vizat fiind bineinteles youtube.
Unele sondaje arata ca in Statele Unite 50% dintre firme blocheaza accesul la site-uri ca Facebook sau Youtube, eu as fi curios care ar fi acest procentaj in Romania. Oare cat de justificata este aceasta masura?
Bineinteles ca angajatul ar trebui sa fie liber sa faca browsing atata timp cat isi face treaba, insa unii angajatori prefera sa se asigure de productivitatea muncii blocand din start accesul la site-urile de gen. Insa ca angajat, daca esti atat de iresponsabil incat seful sa te vada tot timpul pe youtube si ajungi sa ratezi un deadline din cauza asta, atunci chiar meriti sa fii blocat. Voi ce parere aveti? Sau sunteti prea ocupati pe hi5?
5 Comments » 12Sep Spam filtru gratis - Gmail? Tips and tricks
Ca voi toti, am avut si eu o mare problema de ani de zile - SPAM-ul pe mail.
Patru conturi de serviciu + doua personale + Microsoft Outlook => tone de spam. Pe net solutii cu gramada, comerciale si freeware pe care le-am si incercat. In final am ajus sa folosesc SpamAware care e gratuit si prinde 99% din spam. Programul foloseste algoritmi Bayes prin care invata sa diferentieze mail-ul bun de junk, si in general se comporta foarte bine. Totusi dupa aprox. 6 luni de folosire a pluginului de outlook, am observat ca imi incetineste clientul destul de tare, mai ales la startup si are o viteza de scan destul de scazuta. Astfel am pornit in cautarea unei solutii noi, si tot analizand mi-a venit o idee foarte buna:
mi-am forwardat toate conturile de mail catre contul de google.
O solutie super simpla, gratuita, care ofera urmatoarele avantaje:
- in Outlook sync-ul se face cu un singur cont (rapiditate)
- spam filtru performant gratuit
- ai acces la toata informatia de pe toate conturile de mail, cu ajutorul unui singur cont
- acces la toate email-urile remote folosind doar un browser (on the go, fara laptop)
- acces mobil la toate email-urile (folosind aplicatia Gmail mobile)
Dupa cinci luni de utilizare a solutiei, practic am scapat de spam si outlookul zboara! Cei care nu pot sa-si forwardeze conturile nu trebuie sa dispere, in gmail au optiunea “Get mail from other accounts:(download mail using POP3)” in settings/accounts.
Daca aplicati aceasta metoda, va sfatuiesc ca periodic sa verificati junk folderul, e probabil ca unele
mail-uri bune sa ajunga acolo… dar si pentru asta este o solutie simpla. Cand un mail bun e prins in junk, automat adaugati sender-ul in contact list, si marcati email-ul ca si “not spam”.
Happy mailing!





