Robot d'indexation

Pour mettre en place un CMS efficace, vous avez besoin de données provenant de plusieurs sources différentes, y compris votre propre site Internet. Le robot d'indexation extrait le contenu sous-jacent de votre site, que les connecteurs peuvent transformer en données structurées pour votre CMS en quelques clics. Grâce à des options de configuration hautement personnalisables, le robot d'indexation extrait les informations que vous souhaitez obtenir de votre site Internet, même le texte des fichiers PDF que vous stockez en ligne, pour vous faire gagner du temps et élargir vos options de sources de données.

Récupérez des données de votre site Internet

Le Yext Crawler peut fouiller votre contenu HTML et/ou le contenu de vos fichiers PDF à partir d'un ensemble donné de domaines, de pages ou de sous-pages sous un domaine, vous laissant le contrôle sur le contenu pris en compte dans votre CMS. Si les données de votre site Internet changent régulièrement, mettez en place un planning d'indexations. Si vous avez simplement besoin d'une récupération ponctuelle, réalisez une seule indexation. Vous souhaitez ne pas fouiller un ensemble spécifique de pages ? Mettez les URL indésirables sur liste noire pour que le robot d'indexation les ignore.

Configurez un robot d'indexation

Une fois que votre robot d'indexation a récupéré le contenu HTML sur votre site Internet, un connecteur convertit et structure ce code brut en contenu pour les entités. La configuration hautement personnalisable vous permet d'extraire les données exactes dont vous avez besoin. Vous pouvez spécifier un chemin cible sur la base de sélecteurs CSS ou XPath, ou utiliser des sélecteurs intégrés pour capturer des types de données fréquemment extraits, tels que le titre de la page et le corps du texte. Les connecteurs peuvent extraire du texte, du contenu HTML, des URL, des images et plus encore. Pour en savoir plus sur la façon dont les connecteurs et le robot d'indexation fonctionnent ensemble, cliquez ici.

Transformez vos données

Les données sur votre site Internet ne sont peut-être pas mises en forme exactement comme vous le voudriez dans votre CMS. Tirez parti des transformations dans les connecteurs pour modifier les données récoltées par le robot d'indexation avant leur intégration à Content. Grâce aux connecteurs, prévisualisez les modifications apportées à vos données en temps réel afin de veiller à leur exactitude. Les transformations vous permettent de supprimer les caractères indésirables, de modifier la casse, de rechercher et remplacer du texte, de modifier le format des dates, etc.

Vous souhaitez devenir un expert Yext ?

Rejoignez Hitchhikers, la nouvelle plateforme de formation et communauté Yext, pour tester vos connaissances, gagner des badges et échanger avec les experts.

Créez votre compte gratuit

Yext est le leader de la gestion de votre présence numérique. Découvrez pourquoi.