Gfrktyl

Пример B-дерева степени 4

B-дерево (по-русски произносится как Би-дерево) — структура данных, дерево поиска. С точки зрения внешнего логического представления, сбалансированное, сильно ветвистое дерево. Часто используется для хранения данных во внешней памяти.

Использование B-деревьев впервые было предложено Р. Бэйером (англ. R. Bayer) и Э. МакКрейтом (англ. E. McCreight) в 1970 году.

Сбалансированность означает, что длина любых двух путей от корня до листьев различается не более, чем на единицу.

Ветвистость дерева — это свойство каждого узла дерева ссылаться на большое число узлов-потомков.

С точки зрения физической организации B-дерево представляется как мультисписочная структура страниц памяти, то есть каждому узлу дерева соответствует блок памяти (страница). Внутренние и листовые страницы обычно имеют разную структуру.

Содержание

1 Применение

2 Структура и принципы построения

3 Поиск

4 Добавление ключа

5 Удаление ключа

6 Основные достоинства

7 См. также

8 Литература

9 Ссылки

10 Примечания

Применение |

Структура B-дерева применяется для организации индексов во многих современных СУБД.

B-дерево может применяться для структурирования (индексирования) информации на жёстком диске (как правило, метаданных). Время доступа к произвольному блоку на жёстком диске очень велико (порядка миллисекунд), поскольку оно определяется скоростью вращения диска и перемещения головок. Поэтому важно уменьшить количество узлов, просматриваемых при каждой операции. Использование поиска по списку каждый раз для нахождения случайного блока могло бы привести к чрезмерному количеству обращений к диску вследствие необходимости последовательного прохода по всем его элементам, предшествующим заданному, тогда как поиск в B-дереве, благодаря свойствам сбалансированности и высокой ветвистости, позволяет значительно сократить количество таких операций.

Относительно простая реализация алгоритмов и существование готовых библиотек (в том числе для C) для работы со структурой B-дерева обеспечивают популярность применения такой организации памяти в самых разнообразных программах, работающих с большими объёмами данных.

Структура и принципы построения |

B-деревом называется дерево, удовлетворяющее следующим свойствам:

Ключи в каждом узле обычно упорядочены для быстрого доступа к ним. Корень содержит от 1 до 2t-1 ключей. Любой другой узел содержит от t-1 до 2t-1 ключей. Листья не являются исключением из этого правила. Здесь t — параметр дерева, не меньший 2 (и обычно принимающий значения от 50 до 2000^[1]).

У листьев потомков нет. Любой другой узел, содержащий ключи K1{displaystyle K_{1}} $K_1$ , ..., Kn{displaystyle K_{n}} $K_n$ , содержит n+1{displaystyle n+1} $n+1$ потомков. При этом
1. Первый потомок и все его потомки содержат ключи из интервала $(-infty, K_1)$
2. Для $2le ile n$ , i-й потомок и все его потомки содержат ключи из интервала $(K_{i-1}, K_i)$
3. $(n+1)$ -й потомок и все его потомки содержат ключи из интервала $(K_n, infty)$

Глубина всех листьев одинакова.

Свойство 2 можно сформулировать иначе: каждый узел B-дерева, кроме листьев, можно рассматривать как упорядоченный список, в котором чередуются ключи и указатели на потомков.

Поиск |

Если ключ содержится в корне, он найден. Иначе определяем интервал и идём к соответствующему потомку. Повторяем.

Добавление ключа |

Будем называть деревом потомков некоего узла поддерево, состоящее из этого узла и его потомков.

Вначале определим функцию, которая добавляет ключ K к дереву потомков узла x. После выполнения функции во всех пройденных узлах, кроме, может быть, самого узла x, будет меньше $2t-1$ , но не меньше $t-1$ , ключей.

Если х — не лист,
1. Определяем интервал, где должен находиться K. Пусть y — соответствующий потомок.
2. Рекурсивно добавляем K к дереву потомков y.
3. Если узел y полон, то есть содержит $2t-1$ ключей, расщепляем его на два. Узел $y_1$ получает первые $t-1$ из ключей y и первые $t$ его потомков, а узел $y_2$ — последние $t-1$ из ключей y и последние $t$ его потомков. Медианный из ключей узла y попадает в узел х, а указатель на y в узле x заменяется указателями на узлы $y_1$ и $y_2$ .

Если x — лист, просто добавляем туда ключ K.

Теперь определим добавление ключа K ко всему дереву. Буквой R обозначается корневой узел.

Добавим K к дереву потомков R.

Если R содержит теперь $2t-1$ ключей, расщепляем его на два. Узел $R_{1}$ получает первые $t-1$ из ключей R и первые $t$ его потомков, а узел $R_{2}$ — последние $t-1$ из ключей R и последние $t$ его потомков. Медианный из ключей узла R попадает вo вновь созданный узел, который становится корневым. Узлы $R_{1}$ и $R_{2}$ становятся его потомками.

Удаление ключа |

Если корень одновременно является листом, то есть в дереве всего один узел, мы просто удаляем ключ из этого узла. В противном случае сначала находим узел, содержащий ключ, запоминая путь к нему. Пусть этот узел — $x$ .

Если $x$ — лист, удаляем оттуда ключ. Если в узле $x$ осталось не меньше $t-1$ ключей, мы на этом останавливаемся. Иначе мы смотрим на количество ключей в следующем, а потом в предыдущем узле. Если следующий узел есть, и в нём не менее $t$ ключей, мы добавляем в $x$ ключ-разделитель между ним и следующим узлом, а на его место ставим первый ключ следующего узла, после чего останавливаемся. Если это не так, но есть предыдущий узел, и в нём не менее $t$ ключей, мы добавляем в $x$ ключ-разделитель между ним и предыдущим узлом, а на его место ставим последний ключ предыдущего узла, после чего останавливаемся. Наконец, если и с предыдущим ключом не получилось, мы объединяем узел $x$ со следующим или предыдущим узлом, и в объединённый узел перемещаем ключ, разделяющий два узла. При этом в родительском узле может остаться только $t-2$ ключей. Тогда, если это не корень, мы выполняем аналогичную процедуру с ним. Если мы в результате дошли до корня, и в нём осталось от 1 до $t-1$ ключей, делать ничего не надо, потому что корень может иметь и меньше $t-1$ ключей. Если же в корне не осталось ни одного ключа, исключаем корневой узел, а его единственный потомок делаем новым корнем дерева.

Если $x$ — не лист, а K — его $i$ -й ключ, удаляем самый правый ключ из поддерева потомков $i$ -го потомка $x$ , или, наоборот, самый левый ключ из поддерева потомков $i+1$ -го потомка $x$ . После этого заменяем ключ K удалённым ключом. Удаление ключа происходит так, как описано в предыдущем абзаце.

Основные достоинства |

Во всех случаях полезное использование пространства вторичной памяти составляет свыше 50 %. С ростом степени полезного использования памяти не происходит снижения качества обслуживания.

Произвольный доступ к записи реализуется посредством малого количества подопераций (обращения к физическим блокам).

В среднем достаточно эффективно реализуются операции включения и удаления записей; при этом сохраняется естественный порядок ключей с целью последовательной обработки, а также соответствующий баланс дерева для обеспечения быстрой произвольной выборки.

Неизменная упорядоченность по ключу обеспечивает возможность эффективной пакетной обработки.

Основной недостаток В-деревьев состоит в отсутствии для них эффективных средств выборки данных (т.е. метода обхода дерева), упорядоченных по отличному от выбранного ключа.

См. также |

Поиск в глубину

Поиск в ширину

Сбалансированные (самобалансирующиеся) деревья:

АВЛ-дерево

Матричное дерево

Идеально сбалансированное дерево

Расширяющееся дерево

B+-деревья

2-3-дерево

R-дерево

B*-дерево

Красно-чёрное дерево

Список структур данных (деревья)

Литература |

Левитин А. В. Глава 7. Пространственно-временной компромисс: B-деревья // Алгоритмы. Введение в разработку и анализ — М.: Вильямс, 2006. — С. 331–339. — 576 с. — ISBN 978-5-8459-0987-9
<a href="https://wikidata.org/wiki/Track:Q21694518"></a><a href="https://wikidata.org/wiki/Track:Q21694521"></a><a href="https://wikidata.org/wiki/Track:Q21694522"></a>

Томас Х. Кормен, Чарльз И. Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн. Глава 18. B-деревья // Алгоритмы: построение и анализ = Introduction to Algorithms. — 2-е изд. — М.: Вильямс, 2006. — С. 515—536. — ISBN 0-07-013151-1.

Ссылки |

http://algolist.manual.ru/ds/s_btr.php

Визуализаторы В-деревьев

видео: B-дерево - объяснение алгоритма заполнения дерева

Примечания |

↑ Томас Х. Кормен, Чарльз И. Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн. Глава 18. B-деревья // Алгоритмы: построение и анализ = Introduction to Algorithms. — 2-е изд. — М.: Вильямс, 2006. — С. 515—536. — ISBN 0-07-013151-1.

[cormen-1] Томас Х. Кормен, Чарльз И. Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн. Глава 18. B-деревья // Алгоритмы: построение и анализ = Introduction to Algorithms. — 2-е изд. — М.: Вильямс, 2006. — С. 515—536. — ISBN 0-07-013151-1.

Дерево (структура данных)
Двоичное дерево поиска Дерево (теория графов) Древовидная структура
Двоичные деревья	Двоичное дерево T-дерево
Самобалансирующиеся двоичные деревья	АА-дерево АВЛ-дерево Красно-чёрное дерево Расширяющееся дерево Дерево со штрафами Декартово дерево Дерево Фибоначчи B-деревья
B-деревья	B-дерево 2-3-дерево B+-дерево B*-дерево B^x-дерево UB-дерево 2-3-4 дерево (a,b)-дерево Танцующее дерево
Префиксные деревья	Суффиксное дерево Базисное дерево Ternary search tree
Двоичное разбиение пространства	k-мерное дерево VP-дерево
Недвоичные деревья	Дерево квадрантов Октодерево Sparse Voxel Octree Экспоненциальное дерево PQ-дерево
Разбиение пространства	R-дерево R-дерево Гильберта R+-дерево R*-дерево X-дерево M-дерево Дерево Фенвика Дерево отрезков
Другие деревья	Куча Дерево хешей Finger tree Metric tree Дерево покрытий BK-tree Doubly-chained tree iDistance Link-cut tree LSM-дерево
Алгоритмы	Поиск в ширину Поиск в глубину DSW-алгоритм Алгоритм связующего дерева

Структуры данных
Списки	Массив Односвязный список Двусвязный список Список с пропусками
Деревья	B-дерево Двоичное дерево поиска AVL-дерево Красно-чёрное дерево Куча
Графы	Ориентированный граф Направленный ациклический граф Бинарная диаграмма решений Гиперграф
Прочие	Хеш-таблица

搜尋此網誌