Cookies: Ce site utilise des cookies et des services tiers pour la mesure de son audience. Sa consultation nécessite votre consentement à cet avertissement.

Recherche & Développement

Projets précédents

AnnoMarket, Marketplace dans le cloud pour les annotations de données

Un projet européen sur deux années financé par la Commission Européenne à travers le septième programme-cadre de recherche (FP7-SME) sous le numéro 296322. Le projet a démarré en juin 2012.

AnnoMarket veut révolutionner le marché de l’annotation de données, en proposant dans le domaine des ressources et services d’extraction multilingues une place de marché ouverte, accessible, et dotée d’un paiement sur compte rechargeable.

Le site du projet…Notre contribution:

  • Crawl web à grande échelle et crawl web ciblé.
  • Fourniture de corpora web multilingues.
DOPA, Supply Chain de données pour les pools, les services et les statistiques en économie et finance

un projet européen sur deux années, financé par la Commission Européenne à travers le septième programme-cadre de recherche (FP7-SME) et sous le numéro 296448. Le projet a démarré en mai 2012.

DOPA permet des avancées importantes dans le domaine du sourcing en informations de qualité et celui de leur traitement sur plateforme distribuée. Le projet permet de réunir les données issues de sources disparates grace au repérage automatique des entités et de tirer profit de ces données au moyen d’outils de visualisation.

Site du projet… Notre contribution :

  • Création de séries chronologiques multilingues d’informations juridiques et financières issues du web et des réseaux sociaux.
  • Respect strict des cadres juridiques, de la propriété intellectuelle et de la confidentialité.
  • Sélection des sources actives (flux RSS, news, forums, blogs, …) qui sont orientés sur différents aspects du domaine (E-réputation, avis de consommateurs, trading, informations corporate, etc.)
  • Permettre la collecte à grande échelle sans renoncer à la qualité.
TrendMiner, mining à grande échelle et synthèse multilingue des tendances au sein des médias en flux / temps réel.

Un projet européen sur 3 ans financé par la Commission Européenne à travers le septième programme-cadre de recherche (FP7-ICT) sous le numéro 287863. Le projet a démarré en novembre 2011.

Le but de ce projet est de fournir des méthodes temps réel innovantes, portables et open-source pour le mining à grande échelle et synthèse multilingue des tendances au sein des médias en flux / temps réel. Cet objectif est atteint au moyen d’une approche interdisciplinaire, qui associe les méthodes de l’analyse linguistique profonde à grande échelle, l’état de l’art en études du web, le machine learning, l’économie et la science politique. Le passage à l’échelle et la maîtrise des coûts sont effectués avec une infrastructure cloud pour le traitement en temps réel des données de flux media.

Site du projet…Notre contribution:

  • Fourniture d’une infrastructure scalable aux partenaires, support pour l’intégration et l’expérimentation.
  • Conception et développement d’un système applicatif de crawl adapté aux réseaux sociaux.
Rethink Big, Feuille de route européenne pour les technologies matérielles et réseau du Big Data

Rethink big est un projet européen sur deux années, financé par la Commission Européenne à travers le septième programme-cadre de recherche (FP7-ICT / Support Actions) enregistré sous le numéro 619788. Le projet a démarré en mars 2014.

L’objectif du projet Rethink Big est de réunir les concepteurs et consommateurs essentiels du Big Data en Europe pour produire une vision cohérente et précise des différents défis économiques et techniques européens du calcul et de l’analyse Big Data, et de réussir en répondant aux besoins du domaine pour les 10 prochaines années.

Site du projet…Notre contribution:

  • Gestion des données à grande échelle.
  • Contrôle et optimisation de la chaîne de calcul, du matériel au logiciel, en accord avec l’approche “datacenter as a computer”, dans le but de réduire les coûts au minimum possible actuellement
  • Experimenter le datacenter sans refroidissement et designer avec No Rack des serveurs non conventionnels pour optimier la performance par euro investi, tant pour le calcul que pour le stockage de données hétérogènes non structurées issues du web.