четверг, 1 апреля 2010 г.

Про СУБД MySQL и хранилище InnoDB, и про иерархические структуры =)

Не поверите, я искал и нашёл то, что хотел :D

Предисловие

Я пишу одно веб-приложение на PHP, которое использует MySQL в качестве СУБД и одна из задач этого приложения - создание, редактирование, удаление и вкладывание неких категорий друг в друга. Понятно, что данные о категориях должны храниться иерархически.

Не долго думая я построил одну таблицу для своих категорий и написал функцию на PHP которая может рекурсивно вычитывать "дерево" категорий.

Суть таблицы в том, что есть идентификатор поля (id) и идентификатор "родителя" (pid), в поле pid мы записываем id родителя.

Вчера добавлял в своё приложение возможность удалять категории, а т.к. у каждой категории могут быть свои дети, внуки, правнуки и т.п., логично удалять их тоже. Сказано - сделано. Продемонстрировал свой 40-а минутный труд сотруднику на что он мне сказал: "А зачем ты удаляешь на уровне программы, удаляй записи на уровне СУБД". Я на несколько секунд оторопел, потому что в голову даже такая мысль и не приходила, после чего спросил: "подскажи, что загуглить?". Он ответил: "delete cascade или foreign key". И начались поиски...

InnoDB вместо MyISAM

первое куда я попал это конечно dev.mysql.com:
http://dev.mysql.com/doc/refman/5.1/en/innodb-foreign-key-constraints.html
после чего я понял, что мне нужно понять, что такое "InnoDB" :)))
следующая полезная ссылка для меня была на википедии. Там же нашёл ссылку на статью, которая вкратце и доступно объясняет что такое InnoDB, MyISAM, в чём разница и с чем их лучше кушать:
"Нужно ли переходить с MyISAM на InnoDB?"
после чего обратно курить доки по mysql, потом опять гуглить, в итоге, по запросу "древовидная иерархия innodb" надыбал замечательную статью на opennet'e "Иерархические структуры данных и Doctrine"

Иерархические структуры

В первую очередь, хочу выразить огромную благодарность Михаилу Стаднику, автору статьи, за огромный труд при написании статьи.

В данной статье очень подробно рассмотрено 3 основных подхода в организации хранения деревьев в реляционных БД:

* Список смежных вершин (Adjacency List)


* Вложенное множество (Nested Set)


* Материализованный путь (Materialized Path)

Также очерчены все достоинства и недостатки этих методов. И всё это подкреплено множеством примеров запросов. А особенно порадовали тесты на производительность.



В общем, всем кому пришлось столкнутся с "деревьями" - рекомендую. Статья - супер :)

2 комментария:

  1. Почитал=) Как говорил Ручечник -
    "тебе б начальник книги писать" =).
    Очень нехило. Для начала. Ей- богу.

    ОтветитьУдалить
  2. хорошо написано - а главное - красиво описано решаемые проблемы и сохранено источники.

    ОтветитьУдалить