Home > Википедия > Как сделать копию Википедии. Подходы.

Как сделать копию Википедии. Подходы.

Наверняка Вы оказались на этой странице в связи с желанием сделать копию Википедии. Это не удивительно, Википедия — пускай и не абсолютно точный и достоверный источник, но как источник научно-популярных статей вполне годная энциклопедия. Существуют разные подходы к копированию википедии. Например, в самой Русской Википедии есть целая статья, посвящённая этому процессу. В статье описывается подход с установкой движка MediaWiki и импортом дампа русской Википедии. Некоторые особенности данного подхода:
1. помимо дампа, который весит более 2 ГБ, нужно также скачать ряд других файлов, суммарным объёмом примерно 2,7 ГБ, при этом скачивать можно только в 1 поток, что неудобно. Кроме того, скорость скачивания ограничено примерно значением 300 кбайт в секунду.
2. Необходимо установить веб-сервер на свой компьютер (XAMPP,  STPServer или Denwer), что может быть затруднительно для ряда пользователей.
3. Довольно длительный процесс импорта дампов.
4. При переустановке системы всё придётся делать заново.
5. Картинки в этом варианте копирования Википедии отстутствуют.

Есть и другой подход. В репозиториях Википедии хранятся статические копии Википедии за 2007-2008 годы. Да, немного староваты и в них тоже нет картинок, а также нет поиска.

Кроме того, можно скачать дамп Википедии и поизвращаться с генерацией статей с помощью альтернативных парсеров (для продвинутых пользователей), например, Wiky.php, Mediawiki2HTML Machine или Text_Wiki_Mediawiki. Я проверял эти альтернативные парсеры mediawiki, но ни один из них адекватно не работает. В частности, форматирование таблиц оказалось не по зубам всем трём парсерам.

На торрентах также можно встретить текстовые копии Википедии в формате WikiTaxi или Dict. Сами по себе статьи в этих форматах представляют из себя текст с вики-разметкой, что снижает удобочитаемость.

Можно, конечно, скопировать Википедию с применением софта для копирования вебсайтов, но представьте себе, как долго этот процесс будет идти и какой объём займёт полученная копию?

В общем, пожалуй, только официальный подход к копированию Википедии можно признать адекватным для большинства пользователей. Все остальные либо кривы до невозможности, либо чересчур сложны.

+2
-1
  

19.09.2012 · Алексей · Comments Closed Просмотров: 260
Метки: , , , , ,  · Рубрики: Википедия