Acasă Finanțe personale Algoritmi de streaming și filtre Bloom - manechine

Algoritmi de streaming și filtre Bloom - manechine

Video: YouTube e la Pedofilia: l'Adpocalypse 2 è il meno! 2024

Video: YouTube e la Pedofilia: l'Adpocalypse 2 è il meno! 2024
Anonim

În centrul multor algoritmi de streaming sunt filtrele Bloom. Creat acum aproape 50 de ani de către Burton H. Bloom, într-un moment în care știința informaticii era încă destul de tânără, intenția inițială a creatorului acestui algoritm a fost aceea de a schimba spațiul (memoria) și / sau timpul (complexitatea) împotriva a ceea ce el a numit erori admise. Hârtia sa originală este intitulată Comportament spațiu / timp în codificare Hash cu erori admise.

S-ar putea să te întrebi despre spațiul și timpul pe care Bloom îl consideră motivați pentru algoritmul său. Imaginați-vă că trebuie să determinați dacă un element a apărut deja într-un flux utilizând o structură de date discutată anterior. Găsirea unui lucru într-un flux implică înregistrarea și căutarea sunt rapide, astfel că o tabelă de tip hash pare a fi o alegere ideală. Tabelele Hash trebuie doar să adăugați elementele pe care doriți să le înregistrați și să le stocați. Recuperarea unui element dintr-o tabelă hash este rapidă deoarece tabelul hash utilizează valorile ușor manipulate pentru a reprezenta elementul, mai degrabă decât elementul în sine (care ar putea fi destul de complex). Cu toate acestea, stocarea atât a elementelor, cât și a unui indice pentru aceste elemente are limitări. Dacă o tabelă de hash se confruntă cu mai multe elemente decât se poate ocupa, cum ar fi elementele dintr-un flux continuu și potențial infinit, veți termina probleme de memorie la un moment dat.

O considerație esențială pentru filtrele Bloom este că se pot produce fals pozitive, dar negative false nu pot. De exemplu, un flux de date ar putea conține date de monitorizare în timp real pentru o centrală electrică. Atunci când se utilizează un filtru Bloom, analiza fluxului de date ar arăta că citirile așteptate sunt probabil parte a setului de citiri permise, cu unele erori admise. Cu toate acestea, atunci când apare o eroare în sistem, aceeași analiză arată că citirile nu fac parte din setul de citiri permise. Falsul pozitiv este puțin probabil să provoace probleme, dar absența unor falsuri negative înseamnă că toată lumea rămâne în siguranță. Din cauza potențialului pentru rezultate pozitive false, filtrele, cum ar fi filtrul Bloom, sunt structuri probabilistice de date - ele nu oferă un anumit răspuns, ci unul probabil.

Hashes, intrările individuale într-o tabelă hash, sunt rapide deoarece se comportă ca indexul unei cărți. Utilizați o funcție hash pentru a produce hash; intrarea este un element care conține date complexe, iar ieșirea este un număr simplu care acționează ca un indice pentru acel element. O funcție hash este deterministă deoarece produce același număr de fiecare dată când o hrăniți cu o intrare specifică de date.Utilizați hash-ul pentru a găsi informațiile complexe de care aveți nevoie. Filtrele de bloom sunt utile deoarece acestea reprezintă un mod frugal de a înregistra urme ale multor elemente fără a fi nevoie să le depozitați ca o tabelă de tip hash. Ei lucrează într-un mod simplu și folosesc următoarele ingrediente principale:

  • Un vector bit: O listă de elemente de biți, în care fiecare bit din element poate avea o valoare de 0 sau 1. Lista este lungă numărul de biți numiți m. Cu cât m este mai mare, cu atât mai bine, deși există modalități de a defini în mod optim dimensiunea sa.
  • O serie de funcții hash: Fiecare funcție hash reprezintă o valoare diferită. Funcțiile hash pot scurta rapid datele și pot produce rezultate uniform distribuite, rezultate egale variind de la valorile minime la cele maxime de ieșire ale hash-ului.
Algoritmi de streaming și filtre Bloom - manechine

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...