Accueil

DoBuKe est une clef USB bootable basée sur Ubuntu "orientée data" contenant une palette complète d'outils libres destinés à l'acquisition des données (scraping), à leur nettoyage et enrichissement (datacleansing) ainsi qu'à leur visualisation.

DoBuKe est particulièrement utile pour les datajournalistes et les formateurs en datajournalisme. Elle permet notamment de déployer rapidement un environnement de travail homogène sur un parc de machines hétérogènes (PC ou Mac).

DoBuke permet également de traiter rapidement des données en mobilité, sans avoir à réinstaller tous ses outils habituels sur une machine qui n'est pas la sienne.

DoBuKe est gratuit.

DoBuKe est créé dans un environnement virtualisé sur la base d'une distribution Xubuntu 17.10 à jour.

Sur ce socle sont installées les applications et menus spécifiques à DoBuKe.

L'ensemble est ensuite packagé avec Pinguy Builder, selon ce tutoriel.


Vous avez dit DoBuKe?

Dobuke est une ville japonaise proche de Niigata.

Mais DoBuKe est aussi l'acronyme de Data Oriented Bootable USB Key.
DoBuKe est basée sur Xubuntu, une distribution linux légère. Elle contient une liste impressionnante d'outils pour faciliter la collecte, le nettoyage, l'enrichissement et la visualisation de données.

Comment utiliser DoBuKe?

  • Sous Windows : 

Téléchargez LILI USB Creator. Cet outil permet de créer facilent une clef USB bootable à partie de l'image ISO de DoBuKe.

  • Sous linux ou Mac : 

Téléchargez Unetbootin qui fait la même chose.

Pour booter sur une clef USB avec un Mac, il suffit d'insérer la clef USB, puis d'appuyer sur Option (⌥) en démarrant la machine, puis choisir EFI Disque.

  • Dans une machine virtuelle : 

Il est possible d'utiliser l'image ISO comme disque principal d'une VM sur Virtualbox par exemple.



Les Outils de DoBuKe

  • Datacleansing : 

OpenRefine 2.8 et ses plugins vibs.

Tabula 1.1.1, pour l'extraction de données tabulaires dans les pdf.

CsvKit, un outil python pour manipuler facilement les fichiers csv

Jq, pour manipuler aisément les fichiers Json.

Rattle, un outil GTK pour R

LibreOffice Calc, parce qu'il faut bien un tableur! Writer est là aussi...

pdftotext, pour extraire du texte des fichers pdf.

Data-tools, le couteau suisse de la manipulation de fichiers csv, xml et autres

XMLStartlet, le Jq des fichiers xml.

Ripgrep, un grep sous steroïde

Recoll, pour l'indexation de fichiers


  • Visualisation :

Gephi, pour la visualisation de graphes.

Raw, un outil de visualisation et d'exploration de données.

Khartis, l'application de création de cartes de l'atelier de cartographie de SciencesPo.

QGis, le SIG libre pour la cartographie

Inkscape, un éiteur de fichiers svg


  • Bases de données : 

MySQLWorkbench, pour administrer des bases de données SQL.

DBeaver, outil de gestion de base de données.

Apache Drill, un outil puissant pour requêter en SQL des bases de données non-SQL.

  • Chiffrement : 

GPG, l'outil libre de chiffrement

KeypassXC, pour gérer ses trousseaux de mots de passe.

Veracrypt, pour chiffrer facilement ses supports numériques.

Magic-Wormhole, pour transmettre des fichiers de manière sécurisée

  • Navigation et scraping : 

Chromium et ses plugins Scraper et D3js deconstructor.

Firefox.

Scrapy 1.5, un framework de scraping pour Python.

  • Développement et IDE : 

Eric, un IDE pour Python, avec SciKit, Pandas et NumPy

Mini-Conda, pour installer facilement les paquets Anaconda pour python

RStudio, un IDE pour R.

Atom, un éditeur puissant "à la Sublime Text"




Téléchargez DoBuKe

  • DoBuKe iso (V1.2 21/01/2018)

- Direct Download :  http://dl.free.fr/r9wbEZtCf

- Bittorrent : Fichier Torrent

Merci de maintenir vos fichiers en seed après le téléchargement.

  • DoBuKe hash : 

- MD5 412e606fdd15e5bdd2b5dd9cae7104aa  DoBuKe210118.iso

- SHA 256 : 001bafaadaac4716cca56b79f6b2eaa1a9d699efac0355b890ff8e340345cd4c  DoBuKe210118.iso


Le compte utilisateur par défaut est dobuke, et le mot de passe Dobuke?!.

Licence : DoBuKe est composé uniquement de logiciels libres GPL ou BSD.
Elle est donc libre selon les mêmes termes.


Note de version

V1.2 : (21/01/18)

Ajout de Recoll. Correction d'un lien manquant pour Tabula.

V1.1 : (21/01/18)

Passage effectif à Ubuntu 17.10, mise à jour kernel (Meltdown et Spectre)

Ajout de Magic Wormhole, Inkscape, Ripgrep, Mini-conda.

Refine Stats, geckodriver for selenium, Mr-data-converter.

Ajout de signets OSINT dans Firefox.

V1.0 : Initial release (08/01/2018)

- MD5 : 0fbb0e82f926ebd870962582b854fdbb  dobuke.iso - SHA256: 5606e7f27cdcdd61b082d0679a84fc87f928d6630c6bf0cde067833ab3db47aa  dobuke.iso

http://dl.free.fr/woG1nG7zS

ToDo...

  • Internationalisation
  • Mettre le script de packaging sur Github (c'est en cours)
  • Jolification
  • Automatisation de la création de la clef (c'est bien avancé)
  • Alléger l'ensemble : meilleur rapport poids/puissance
  • Un vrai site web (là c'est moche...)
  • ...

Si vous souhaitez participer à l'aventure DoBuKe, ou si vous avez des suggestions, n'hésitez pas à me contacter!

dobuke||@||dobuke.||org

(Enlever les 'pipes' pour que l'adresse soit valide)

Ou sur Twitter.


FàQ et known issues

- Le graphe du réseau, dans la barre des tâches fonctionne en réglant le bon périphérique réseau.

- L’icône Tabula dans le dock plante. Mais l'entrée dans le menu principal, section DoBuKe, fonctionne.