vendredi 18 septembre 2009

La technologie Captacha dans le giron de Google : numériser tous les livres du monde

Google met la main sur ReCaptcha et sa technologie de numérisation.

Basé à Pittsburgh, aux Etats-Unis, ReCaptcha est une émanation de l'université Carnegie Mellon, emploie moins de dix personnes.

 

ReCaptcha a lancé la technologie Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart) permettant de forcer la saisie d’un code dessiné dans une image, et distinguer ainsi les utilisateurs humains d'un site des robots logiciels.

SNAG-603OCR et numérisation

Ce qui intéresse google c’est le savoir faire en reconnaissance optique de caractères (OCR) de l’équipe de ReCaptcha.

Le projet de numérisation du savoir papier du Monde entier, a besoin de ce type de technologie.

Ainsi, Goggle va pourvoir améliorer la qualité de numérisation de livres anciens via Google Books. Tout l’enjeu est de pouvoir augmenter la pertinence des recherches de son moteur destiné aux livres et de générer derrière de la publicité.

La question qui persiste, Que va faire Goggle pour les livres chinois, arabe et autres langues … ?

Mais ceci est un autre sujet.

4 commentaires :

boulabiar a dit…

"Que va faire Goggle pour les livres chinois, arabe et autres langues"

Pour l'arabe, ne faut-il pas que nous faisons une chose avant d'attendre Google?

Il y a des projets de recherche qui sont lancés et des thèses dans les labos tunisiens. Mais ils finissent tous dans des bibliothèques abandonnées parce que les M. et les Mlle ont le seul but d'avoir le diplôme de thèse pour enseigner et dormir.

La notion de la recherche appliquée et d'appliquer les résultats sur des projets accessibles à tout le monde n'existe pas malheureusement.

Khaled BEN DRISS a dit…

Tout à fait, la recherche doit être globale on elle n'aura pas lieu et ne donnera aucun résultat
Une vision cohérente et coordonnées entre recherche fondamentale et recherche pratiques et valorisation des résultats de recherche, est nécessaire.

d'ailleurs, Google a été lancé par des diplômés d'une université qui travaille sur les moteurs de recherche ...
d'autre part, il n'est toujours obligatoire de tout faire par soit même
la Bibliothèque nationale de France (BNF)va suivre les pas de la bibliothèque de Lyon avec 510.000 documents numérisés, le Congrès américain, Harvard et Oxford, qui utilisent les technlogies de numérisation de Goggle

Anonyme a dit…

Bonjour Mr Kahled
Je suis un jeune développeur java
Je commence à publier des articles Java sur mon blog (JSF, Spring, JPA, Hibernate, Flex , BlazeDS, ....)
http://zarouimarouan.unblog.fr
Je vous invite à le voir (Laissez vos commentaire), ca va etre un honeur pour moi.
Je vais suivre votre chemain et aussi celui des grands bien sur(Rod Johnson , Gavin King...) à contribuer dans le monde opensource java (Inchallah)
Je vous remercie d'avance.
Zaroui Marouan

Khaled BEN DRISS a dit…

avec plaisir,
et bonne continuation

le choix de Spring Flex est judicieux, il est d'actualité et le sujet n'a pas encore été largement exploré

http://www.journaldunet.com/developpeur/expert/36983/spring--eclipse---flex---quelle-relation.shtml

issue de mon article sur le Blog
http://net-progress.blogspot.com/2009/03/spring-eclipse-flex-quelle-relation.html

cordialement
Khaled


Khaled BEN DRISS

Enregistrer un commentaire

Architecte SOA & Professionnel Open Source Headline Animator

 
Khaled BEN DRISS
Cloud Computing, SOA et Web 2.0 : Des sujets techniques sur SOA et l'Open Source : de Java & .Net, PHP5, Symfony, à SaaS / PaaS en passant par Azure, google appengine, le BPM, la Modélisation et d'autres sujets du coté du serveur et cloud computing.