mirror of
https://github.moeyy.xyz/https://github.com/trekhleb/javascript-algorithms.git
synced 2024-12-25 14:26:09 +08:00
Translate Bloom filter into Russian. (#320)
This commit is contained in:
parent
e286a92d8d
commit
43e1cca3e6
@ -1,5 +1,8 @@
|
||||
# Bloom Filter
|
||||
|
||||
_Read this in other languages:_
|
||||
[_Русский_](README.ru-RU.md)
|
||||
|
||||
A **bloom filter** is a space-efficient probabilistic
|
||||
data structure designed to test whether an element
|
||||
is present in a set. It is designed to be blazingly
|
||||
|
56
src/data-structures/bloom-filter/README.ru-RU.md
Normal file
56
src/data-structures/bloom-filter/README.ru-RU.md
Normal file
@ -0,0 +1,56 @@
|
||||
# Фильтр Блума
|
||||
|
||||
**Фильтр Блума** - это пространственно-эффективная вероятностная структура данных, созданная для проверки наличия элемента
|
||||
в множестве. Он спроектирован невероятно быстрым при минимальном использовании памяти ценой потенциальных ложных срабатываний.
|
||||
Существует возможность получить ложноположительное срабатывание (элемента в множестве нет, но структура данных сообщает,
|
||||
что он есть), но не ложноотрицательное. Другими словами, очередь возвращает или "возможно в наборе", или "определённо не
|
||||
в наборе". Фильтр Блума может использовать любой объём памяти, однако чем он больше, тем меньше вероятность ложного
|
||||
срабатывания.
|
||||
|
||||
Блум предложил эту технику для применения в областях, где количество исходных данных потребовало бы непрактично много
|
||||
памяти, в случае применения условно безошибочных техник хеширования.
|
||||
|
||||
## Описание алгоритма
|
||||
|
||||
Пустой фильтр Блума представлен битовым массивом из `m` битов, все биты которого обнулены. Должно быть определено `k`
|
||||
независимых хеш-функций, отображающих каждый элемент множества в одну из `m` позиций в массиве, генерируя единообразное
|
||||
случайное распределение. Обычно `k` задана константой, которая много меньше `m` и пропорциональна
|
||||
количеству добавляемых элементов; точный выбор `k` и постоянной пропорциональности `m` определяются уровнем ложных
|
||||
срабатываний фильтра.
|
||||
|
||||
Вот пример Блум фильтра, представляющего набор `{x, y, z}`. Цветные стрелки показывают позиции в битовом массиве,
|
||||
которым привязан каждый элемент набора. Элемент `w` не в набора `{x, y, z}`, потому что он привязан к позиции в битовом
|
||||
массиве, равной `0`. Для этой формы , `m = 18`, а `k = 3`.
|
||||
|
||||
|
||||
Фильтр Блума представляет собой битовый массив из `m` бит. Изначально, когда структура данных хранит пустое множество, все
|
||||
`m` бит обнулены. Пользователь должен определить `k` независимых хеш-функций `h1`, …, `hk`,
|
||||
отображающих каждый элемент в одну из `m` позиций битового массива достаточно равномерным образом.
|
||||
|
||||
Для добавления элемента e необходимо записать единицы на каждую из позиций `h1(e)`, …, `hk(e)`
|
||||
битового массива.
|
||||
|
||||
Для проверки принадлежности элемента `e` к множеству хранимых элементов, необходимо проверить состояние битов
|
||||
`h1(e)`, …, `hk(e)`. Если хотя бы один из них равен нулю, элемент не может принадлежать множеству
|
||||
(иначе бы при его добавлении все эти биты были установлены). Если все они равны единице, то структура данных сообщает,
|
||||
что `е` принадлежит множеству. При этом может возникнуть две ситуации: либо элемент действительно принадлежит множеству,
|
||||
либо все эти биты оказались установлены по случайности при добавлении других элементов, что и является источником ложных
|
||||
срабатываний в этой структуре данных.
|
||||
|
||||
![Фильтр Блума](https://upload.wikimedia.org/wikipedia/commons/a/ac/Bloom_filter.svg)
|
||||
|
||||
## Применения
|
||||
|
||||
Фильтр Блума может быть использован для блогов. Если цель состоит в том, чтобы показать читателям только те статьи,
|
||||
которые они ещё не видели, фильтр блума идеален. Он может содержать хешированные значения, соответствующие статье. После
|
||||
того, как пользователь прочитал несколько статей, они могут быть помещены в фильтр. В следующий раз, когда пользователь
|
||||
посетит сайт, эти статьи могут быть убраны из результатов с помощью фильтра.
|
||||
|
||||
Некоторые статьи неизбежно будут отфильтрованы по ошибке, но цена приемлема. То, что пользователь не увидит несколько
|
||||
статей в полне приемлемо, принимая во внимание тот факт, что ему всегда показываются другие новые статьи при каждом
|
||||
новом посещении.
|
||||
|
||||
## Ссылки
|
||||
|
||||
- [Wikipedia](https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D1%8C%D1%82%D1%80_%D0%91%D0%BB%D1%83%D0%BC%D0%B0)
|
||||
- [Фильтр Блума на Хабре](https://habr.com/ru/post/112069/)
|
Loading…
Reference in New Issue
Block a user