Verticrawl

Un article de Wikipédia, l'encyclopédie libre.

Verticrawl
Importez le logo de cette entreprise
Fiche d’identité
Forme juridique : SARL
Slogan(s) : « Votre Moteur de recherche interne »
Siège social : France Villemomble
Consultez la documentation du modèle


Verticrawl est un logiciel de moteur de recherche. Lancé en 1999, sa technologie permet l'indexation full-text dans plus de 220 formats de fichier dont Office, Pdf, vidéo et web. En tant que moteur de recherche sémantique, il est capable de reconnaitre 68 langues.

En 2005, La solution de recherche est devenue totalement webservice à vocation SiteSearch. L'outil est donc dédié à une utilisation online ou offline de recherche pour site web. Les activités de gestion de contenu, les sites marchands ou les SEO l'utilise pour mettre en oeuvre une fonction élaborée de recherche sur site.

Sommaire

[modifier] Fonctions d'indexation

Outre les fonctions de crawling web, Verticrawl peut nativement indexer les protocoles https, ftps, news avec ou sans authentification. Étant dédié à une indexation sélective de contenu, l'exploitation de règles d'indexation spécifiques autorise la collecte de données sélective, c'est à dire le crawling vertical (d'où son nom VERTICRAWL).

Le logiciel peut indexer des catalogues produits via des formats éditeur ou directement sur les serveurs de base de données.

Une interface d'administration permet à chaque client de consulter l'ensemble des processus et les données indexées.

[modifier] Fonctions de recherche

Les fonctions de recherche sont mise à disposition sous forme d'api de dialogue avec le centre serveur. Chaque API dispose de 3 formats (Html, Xml ou Php) qui couvrent 99% des besoins d'intégration des recherches sur site. Une aide en ligne contenant des script open source rendent l'intégration simple et rapidement opérationnelle.

  • moteur de recherche sémantique
  • plan de site automatique
  • table des matières automatique (index sémantique)
  • correction orthographique
  • suggestion de recherche associées
  • auto-completion
  • screenshot automatique (image des documents indexés)
  • logiciel de régie publicitaire multimédia et contextuelle nommé answord

Ces fonctions sont toutes interfaçables y compris avec des applicatifs web2.0 ou ajax. Le design de résultats d'un moteur de recherche est totalement paramétrable.

[modifier] Principales fonctions d'administration

  • Multi bases d'indexation
  • Architecture set and forget
  • paramétrage des périodes de crawl
  • statistiques de recherche avec géolocalisation et analyse comportementale
  • paramétrage des APIs.

[modifier] Clients et utilisateurs

Essentiellement des entreprises utilisant internet comme vecteur de leur activité. Il s'agit surtout de collectivités, de PME, de société de référencement SEO et de site e-commerce.

[modifier] Qu'est ce que le Webservice

A l'inverse d'un logiciel installé, le web service supprime toute contrainte d'infrastructure et de mise à jour du logiciel. Le principe de licence mode ASP, garanti une évolution constante du produit ainsi qu'une disponibilité réelle du logiciel pour le client, sans installation. Dans le cas des moteurs de recherche, les ressources techniques sont bien plus complexes à mettre en oeuvre que pour un logiciel classique (disponibilité, charge serveur, coût de l'infrastructure).

De même, le prix de licence est alors beaucoup plus attractif que pour un logiciel dit end-user installé sur un serveur.

[modifier] Évolutions

Verticrawl à intégré des fonctions de data-mining couplées au système de crawl pour extraire des données non structurées directement dans les pages web. E-miner peut collecter des liens en javascript (par exemple), reconnaître un prix, des informations techniques issues d'une fiche produit (sur un site marchand), etc..

Les données ainsi collectées sont exportables au format xml ou base de données pour un système de veille marketing, de comparaison de prix etc...

[modifier] Identité du crawler

Le robot porte le nom suivant VerticrawlBot suivi d'un identifiant client.


[modifier] Notes et références