2 de diciembre de 2008

Kiwix, la wikipedia offline

Desde hace algún tiempo me he dedicado de lleno a un proyecto que me apasiona intensamente. Este proyecto es llamado Kiwix. Bien, este es un software creado para poder leer Wikipedia sin conexión a Internet, en especial, para esos sitios recónditos en donde el acceso a Internet es complicado, o en comunidades en donde no existan los recursos para poseer dicho acceso.

Apenas está en pañales en su versión 0.7 beta, y se están corrigiendo algunas fallas como algunos problemas en el sistema de búsqueda.





Cómo dato interesante es que no simplemente sirve para cargar wikipedia fuera de linea, sino también cualquier proyecto de la fundación wikimedia como lo son: wikilibros, wikidiccionario, wikiespecies, wikisource, wikinoticias...entre otros. Disponible para importar bases de datos de todos los idiomas.

Acá coloco los pasos para la instalación:

1) Descargar el archivo zeno e indices de wikipedia en español disponible desde el enlace de "Download" del mismo programa en la base superior. O bajar en http://ftp.crihan.fr/mirrors/wikipediaondvd.com/es.wikipedia.tar manualmente

2) Entrar a Manage corpus

3) Dar click en ADD

4) Llenar campos del formulario
name : es.wikipedia,
format : zeno,
root : es.wikipedia,
home : A/Wikipedia:Portada,
Index root : path en donde descomprimiste el
archivo es.wikipedia.tar y en donde se encuentra el archivo zeno (Formato comprimido usado para wikipedia offline)

Cómo dato importante, es que es un proyecto GNU/GPL, disponible actualmente para linux, mac y windows.

7 comentarios:

Anónimo dijo...

Amigo muchas gracias por esta entrada. POR FIN!! tengo la wikipedia en mi pc despues de dos horas buscando el ejecutable lo encontre por fin por que en la pagina Gracias por la buena explicacion para la instalacion EXCELENTE APORTE GRACIAS!!!!

DESCAGAR EL EJECUTABLE PARA WINDOWS KIWIX 0.7:
http://es.brothersoft.com/Kiwix-download-135760.html

David B dijo...

Muchas gracias por este post.
¿Alguien sabe donde se puede descargar el archivo zeno de la wikipedia con imagenes?

Muchas gracias.

W dijo...

Amigo, aquí puede descargarlo:

http://tmp.kiwix.org/zim/

David B dijo...

Muchas gracias por este enlace. Solo tengo una pregunta los archivos .ZIM son compatibles con la version 0.7 de kiwix para windows, ya creo que es la version mas reciente para este S.O. y veo que solo soporta HTML, Zeno files. Le funcionaran estos archivos? o en dado caso que programa se usa en windows para consultar la wikipedia.

muchas gracias

W dijo...

Amigo David, en la actualidad se esta desarrollando una versión de kiwix para Windows, sin embargo, puedes utilizar okawix(http://www.okawix.com/) que es la versión desarrollada por la empresa linterweb que ya no pertenece al proyecto kiwix. Un abrazo y espero haber contestado tu pregunta.

Anónimo dijo...

Tengo una duda Kiwix trabaja con un formato zim y okawix trabaja con zeno.
Existe algun programa para descomprimir las extensiones zim y zeno?

W dijo...

No comprendo bien que es lo que quieres hacer. El formato zeno es un formato cerrado y con ciertas desventajas en relacion al nivel de compresion. No es necesario descomprimir estos archivos para poder visualizarlos. Te explicare realizando una simple analogia. Todo el mundo conoce que es un archivo bmp (bitmap picture) y un jpeg. Ambos archivos son de imagen, el primero es un archivo no comprimido, el segundo posee un nivel de compresion dependiendo de la calidad de la imagen que se quiera tener, incluso 0 nivel de compresion.

Mientras que una imagen de 5 MB es el peso en BMP, una imagen jpg con un 2 % de compresion podria pesar 50 kb solamente. Hoy en dia, el formato bmp ha desaparecido casi en su totalidad debido al excelente manejo de calidad vs nivel de compresion del archivo jpg.

En el ejemplo anterior, supongamos que bmp es el contenido de wikipedia sin comprimir y jpg comprimido en formato ZIM. Ambos formatos son la misma cosa y pueden ser accedidos de igual manera sin necesidad de ser descomprimidos, pronto wikimedia adoptara el formato zim como el oficial para realizar respaldos.

Zim utiliza un algoritmo avanzado llamado lzma2 para comprimir la informacion sin perdida. El editor mas avanzado que conozco para leer archivos zim es kiwix.

Espero haberte ayudado