Les moteurs de recherche traditionnels comme Google sont assez bons dans ce qu’ils font, mais de nombreuses personnes choisissent de ne pas les utiliser pour des raisons de confidentialité . Ensuite, il y a ceux qui craignent que le contenu ne passe entre les mailles du filet simplement parce que le créateur n’a pas suivi les meilleures pratiques d’ optimisation pour les moteurs de recherche (SEO) .
YaCy(s’ouvre dans un nouvel onglet), un moteur de recherche distribué open source , fonctionne à peu près comme ses pairs traditionnels, mais ne souffre d’aucun de leurs maux. YaCy utilise un réseau peer-to-peer (P2P), de sorte que chaque utilisateur exécutant une instance du moteur de recherche se joint à l’effort d’indexation d’Internet. L’index est distribué et redondant entre tous les utilisateurs de YaCy.
Pour renforcer davantage ses informations d’identification en matière de confidentialité, YaCy garantit que personne ne peut dire qui a recherché quels mots, ce qui rend toutes les recherches fonctionnellement anonymes.
YaCy n’indexe que les pages accessibles au public et non protégées par mot de passe. Vous pouvez également l’utiliser comme moteur de recherche pour votre site Web ou l’utiliser pour indexer des pages sur l’intranet, ce qui garantit qu’elles ne sont accessibles à personne en dehors de votre réseau.
Installation
YaCy est écrit en Java et fonctionne sous Windows , macOS et Linux . Les moteurs de recherche sont des bêtes complexes, mais grâce à la nature distribuée de YaCy, vous n’avez pas besoin d’une machine rapide, ni de beaucoup d’espace pour exécuter un client YaCy.
L’installation est assez simple. Avant de commencer, assurez-vous que Java est installé sur la machine. Les utilisateurs Windows et macOS peuvent obtenir des binaires pré-construits auprès d’ Adoptium(s’ouvre dans un nouvel onglet), tandis que les utilisateurs de Linux peuvent l’extraire de leurs référentiels officiels.
Par exemple, les utilisateurs de Debian peuvent utiliser sudo apt install default-jdk , tandis que les utilisateurs de Fedora peuvent rechercher les versions disponibles avec sudo dnf search openjdk , avant d’installer la dernière version avec sudo dnf install <openjdk-package-name> .
Une fois Java installé, téléchargez l’exécutable YaCy(s’ouvre dans un nouvel onglet)pour votre plate-forme et extrayez-le. Par exemple, la commande sudo tar –extract –file yacy_*z –directory /opt -v , extraira le programme d’installation sous le répertoire /opt sous Linux. Maintenant, changez simplement dans le répertoire extrait et démarrez YaCy :
# cd /opt/yacy
# ./startYACY.sh
YaCy s’exécute maintenant sur le port 8090 de votre ordinateur. Lancez un navigateur Web et rendez-vous sur http://localhost:8090 pour accéder à l’instance YaCy. Vous pouvez désormais effectuer une recherche sur Internet comme vous le feriez avec un moteur de recherche classique.
Explorer Internet
Vous pouvez faire beaucoup plus avec le moteur de recherche YaCy que simplement rechercher passivement. Par exemple, puisque l’indexation P2P est pilotée par l’utilisateur, vous pouvez demander à YaCy d’explorer n’importe quel site Web.
Pour accéder aux contrôles administratifs avancés de votre moteur de recherche, cliquez sur le bouton Administration dans le coin supérieur droit. Cela fait apparaître le panneau d’administration, qui vous permet entre autres de modifier la façon dont votre instance YaCy interagit avec d’autres clients YaCy du réseau.
Pour lancer une exploration manuelle du Web, accédez à Charger les pages Web, option Crawler dans le menu Premiers pas . Entrez l’URL dans l’espace prévu et cliquez sur Start New Crawl . Au fur et à mesure que le robot d’exploration démarre, il commence à afficher toutes sortes de statistiques sur l’exploration, et vous pouvez faire défiler vers le bas pour afficher graphiquement la structure du site Web défilé.
Après avoir lancé l’exploration, accédez à Monitoring > Index Browser pour afficher le nombre de pages indexées et afficher d’autres détails, tels que leur nom et le nombre de liens sortants.
Pour l’instant, vous pouvez utiliser l’option par défaut et explorer les autres options, telles que la limitation du robot d’exploration, une fois que vous vous serez familiarisé avec YaCy. Le moteur de recherche peut exécuter plusieurs analyses en même temps, et vous pouvez soit les lancer en série à partir de la section Premiers pas , soit vous diriger vers Production > Advanced Crawler pour explorer plusieurs sites Web en même temps.
Une fois le travail d’exploration démarré, YaCy indexe les URL que vous entrez et stocke l’index sur votre ordinateur local. Pour vous assurer que votre index est disponible pour les utilisateurs de YaCy partout dans le monde, vous devrez rejoindre le réseau P2P de YaCy.
Pour cela, vous devez ouvrir le port 8090 dans le pare-feu de votre routeur. Connectez-vous à la page d’administration de votre routeur et recherchez un panneau de configuration contrôlant le pare -feu ou la redirection de port .
Une fois que vous avez trouvé les préférences du pare-feu de votre routeur, ajoutez le port 8090 à la liste blanche. Si votre routeur effectue une redirection de port, vous devez rediriger le trafic entrant vers l’adresse IP de votre ordinateur, en utilisant le même port.
Après avoir rejoint le réseau YaCy, vous pouvez basculer l’ option Do remote indexing sous Advanced Crawler . Cela permet à votre client de diffuser les URL qu’il indexe, et d’autres clients du réseau qui ont choisi d’accepter les requêtes peuvent vous aider à effectuer l’exploration.
Votre propre Google
Au lieu de rechercher sur le Web, vous pouvez utiliser YaCy pour rechercher dans vos propres données ou pour implémenter un système de recherche de partages de fichiers locaux dans votre intranet d’entreprise.
Pour cela, vous devrez exécuter YaCy en tant qu’indexeur interne. Dans ces modes, seules les personnes de votre réseau local peuvent utiliser votre instance personnalisée de YaCy pour rechercher des fichiers partagés, et aucune des données n’est partagée avec des utilisateurs extérieurs à votre réseau.
Dirigez-vous vers Administration > Premiers pas > Cas d’utilisation et compte . Ici, vous pouvez spécifier des détails de base tels que la langue de l’interface de YaCy.
Vous pourrez également modifier le comportement de votre instance YaCy à partir d’ici. L’option par défaut consiste à utiliser votre client dans le cadre du réseau P2P mondial de YaCy pour vous aider à explorer et à indexer le Web.
Pour créer un portail de recherche pour votre propre site Web, vous devez sélectionner l’ option Portail de recherche pour vos propres pages Web . Ensuite, faites défiler vers le bas et appuyez sur le bouton Définir la configuration . Ensuite, vous devez explorer votre domaine pour générer le contenu qui sera disponible via votre outil de recherche.
Pour intégrer la recherche dans votre site Web, faites défiler la colonne de gauche jusqu’à la section Intégration du portail de recherche . Vous êtes redirigé vers la page de configuration du portail , à partir de laquelle vous pouvez personnaliser l’apparence de YaCy avec la marque de votre entreprise pour l’intégrer à votre site Web. Lorsque vous avez terminé, appuyez sur le bouton Modifier la page de recherche . Vous pouvez maintenant utiliser n’importe lequel des extraits de code iframe générés pour intégrer la recherche personnalisée alimentée par YaCy dans votre site Web.
De même, pour utiliser YaCy pour indexer le réseau local, vous devrez sélectionner la troisième option dans la section Premiers pas . Vous pouvez ensuite utiliser Advanced Crawler pour explorer votre intranet.
Conclusion
Il y a tellement plus que vous pouvez faire avec YaCy. Le projet n’offre pas assez de documentation pour couvrir toutes les fonctionnalités du moteur de recherche. Cependant, le projet est assez intuitif et son interface est suffisamment détaillée pour vous aider à basculer vers la bonne option.
Tout bien considéré, YaCy est l’une des meilleures options pour les utilisateurs qui souhaitent un moteur de recherche Web anonyme, impartial, sans publicité et respectueux de la vie privée, que vous pouvez également utiliser pour aider les utilisateurs à rechercher du contenu sur votre site Web ou en privé sur votre intranet.
Pour télécharger et installer votre propre moteur de recherche, cliquez sur le lien suivant: ici
Source : https://www.techradar.com/how-to/build-your-own-search-engine-with-yacy