Miniocr : L'alliance de nodewebkit et de Tesseract-OCR

Présentation du projet

Avez vous déjà rencontré le problème suivant ?
Vous avez un document imprimé sous la main contenant beaucoup de texte. Vous allez devoir recopier ce dernier sur votre éditeur préféré et cela va vous prendre beaucoup de temps...
Les mieux renseignés utiliseront un OCR souvent fourni avec leur scanner. Mais encore faut il être au courant et surtout, pouvoir récupérer ce fameux document car il se peut que vous ne puissiez pas le ramener chez vous !
Voila l'intérêt de ce petit programme ! Attention, c'est une expérimentation afin de pouvoir toucher du doigt certaines technologies qui m'ont parues intéressantes.
Le principe est simple, l'application vous laisse une zone de drop de fichier. Vous lui donnez à manger votre image avec le texte qu'il contient. L'application vous mettra le texte directement dans votre presse-papier ! Cela fonctionne sur des images très propres avec de très bons constrastes.

Point sur les Technologies

Le grand intérêt de cette application desktop était d'utiliser la technologie NodeWebkit. Pour résumer, tout est dans le titre, cette technologie vous permet de développer des applications à l'aide du projet chromium pour les interfaces, donc du 100% web avec Node.js pour les traitements sur la machine cliente.
Même avec une petite application comme celle là, il a un vrai potentiel car si vous savez coder pour le web et surtout en front, vous pouvez développer des applications dans votre environnement très simplement. De plus, un avantage supplémentaire est la portabilité de votre applications sur les différents OS du marché.
L'autre gros morceau de cette application est l'OCR qui s'occupe du traitement des images. Il s'agit du projet Tesseract-OCR. Le projet étant libre les sources sont disponibles et peuvent être compilées au besoin pour un portage sur plusieurs OS (Dans le cas où les version pré-compilé ne vous conviendrez pas...). L'interfaçage entre l'OCR et NodeJs est un jeu d'enfant et c'est tout le coeur du sujet !
Un petit résumé des technologies présentes :

Les plus de ce projet

Mettre en oeuvre des solutions innovantes et dans l'ère du temps. Le javascript devient un langage polyvalent, donnant des possibilités très intéressantes très loin de ses premiers pas chaostiques...

Pour conclure

Un projet avec un objectif simple, une technologie efficace, que du bonheur !
NodeWebkit sera réutilisé dès que possible si un projet d'application desktop s'y prête !