Indexation : Différence entre versions

De OviWiki
Aller à : navigation, rechercher
Ligne 1 : Ligne 1 :
 
== Configurer l'indexation sur Ovidentia ==
 
== Configurer l'indexation sur Ovidentia ==
 +
 +
=== Introduction ===
 +
 +
Le connecteur Swish-e est disponible à partir de la version 6.0.0 d'OVIDENTIA.
 +
A ce jour, le connecteur Swish-e/Ovidentia n'a été validé qu'avec la version 2.4.3 de Swish-e.
 +
L'indexation de fichiers concerne les fonctions du noyau suivantes :
 +
 +
* Les fichiers du gestionnaire de fichiers
 +
* Les fichiers liés aux articles
 +
* Les fichiers liés aux contributions de forum
 +
 +
OVIDENTIA. gère les demandes d'indexation et la recherche plein-texte sur les types de fichiers suivants (les « Modules » Swish-e doivent être présents) :
 +
doc, xls, xml, html, txt, csv, pdf, sxw.
 +
 +
La version Windows de Swish-e ne permet l'indexation que des fichiers doc, xml, html, txt, csv et pdf. Les modules xls2csv et unzip n'étant pas proposés dans les librairies lors de son installation.
 +
 +
Important : OVIDENTIA. délègue totalement l'indexation et la recherche plein texte à Swish-e et ses modules d'indexation (catdoc, pdftotext, unzip ... .). OVIDENTIA. n'est donc pas directement à l'origine de la pertinence de l'indexation ou des résultats remontés.
 +
 +
=== Installation du moteur d'indexation swish-e ===
 +
 +
Le moteur d'indexation « Swish-e » doit être installé sur le serveur hébergeant OVIDENTIA..
 +
 +
Swish-e peut être téléchargé depuis le site : http://swish-e.org
 +
 +
Nous vous invitons à utiliser la documentation d'installation et de configuration présent sur le site de  Swish-e pour son intégration sur votre serveur. http://swish-e.org/docs/index.html
 +
 +
 +
 +
 +
=== Configuration du connecteur Swish-e dans OVIDENTIA. ===
 +
 +
Cette étape ne doit être réalisée qu'après l'installation de Swish-e sur votre environnement.
 +
Pour activer la configuration du moteur d'indexation dans OVIDENTIA., il faut ajouter la ligne suivante dans le fichier config.php qui se trouve à la racine d'OVIDENTIA.  (à placer avant la balise « ?> » ) :
 +
 +
<source lang="php">
 +
 +
$babSearchEngine = 'swish';
 +
 +
</source>
 +
 +
 +
L'accès à la configuration du connecteur Swish-e dans OVIDENTIA. s'effectue en tant qu'administrateur du portail.
 +
Depuis la section « Administration », cliquer sur «sites» puis sur le nom de votre site.
 +
En sélectionnant «Configuration du moteur de recherche»,
 +
Il est nécessaire de renseigner le chemin complet d'accès aux exécutables.
 +
 +
 +
 +
 +
==== Exemple dans un environnement Windows ====
 +
 +
{|
 +
|| Commande swish-e (swish-e.exe) || C:\Progra~1\SWISH-E\swish-e.exe
 +
|-
 +
|| Commande pour transformer les documents pdf en texte (pdftotext.exe)  || C:\Progra~1\SWISH-E\lib\swish-e\pdftotext.exe
 +
|-
 +
|| Commande pour transformer les documents word en texte (catdoc.exe) || C:/Progra~1/SWISH-E/lib/swish-e/catdoc.exe
 +
|-
 +
|| ... || ...
 +
|-
 +
|}
 +
....
 +
Attention : Les noms longs ne sont pas supportés, dans notre exemple C:\Program Files devient  C:\Progra~1.
 +
 +
==== Exemple dans un environnement Linux ====
 +
 +
Dans un environnement linux, la configuration est détectée automatiquement si elle n'est pas renseignée depuis la version 6.6.90 d'Ovidentia. Les emplacements exacts peuvent être saisis pour améliorer les performances ou si les executables sont placé dans des répertoires non reconnus par le système (par la commande whereis)
 +
 +
 +
 +
A noté :
 +
 +
Pour que Ovidentia « communique » avec Swish-e, il est nécessaire que l'utilisateur qui exécute le serveur web (Apache, IUSR_NomDuServeur ...) puissent demander l'exécution de Swish-e.
 +
Dans un environnement IIS 6/Windows 2003 SRV, il est nécessaire de mettre le droit de lecture/exécution au fichier "cmd.exe" qui se trouve dans "windows/system32" pour l'utilisateur IUSR_NomDuServeur.
 +
 +
  
  

Version du 25 février 2008 à 17:28

Configurer l'indexation sur Ovidentia

Introduction

Le connecteur Swish-e est disponible à partir de la version 6.0.0 d'OVIDENTIA. A ce jour, le connecteur Swish-e/Ovidentia n'a été validé qu'avec la version 2.4.3 de Swish-e. L'indexation de fichiers concerne les fonctions du noyau suivantes :

  • Les fichiers du gestionnaire de fichiers
  • Les fichiers liés aux articles
  • Les fichiers liés aux contributions de forum

OVIDENTIA. gère les demandes d'indexation et la recherche plein-texte sur les types de fichiers suivants (les « Modules » Swish-e doivent être présents) : doc, xls, xml, html, txt, csv, pdf, sxw.

La version Windows de Swish-e ne permet l'indexation que des fichiers doc, xml, html, txt, csv et pdf. Les modules xls2csv et unzip n'étant pas proposés dans les librairies lors de son installation.

Important : OVIDENTIA. délègue totalement l'indexation et la recherche plein texte à Swish-e et ses modules d'indexation (catdoc, pdftotext, unzip ... .). OVIDENTIA. n'est donc pas directement à l'origine de la pertinence de l'indexation ou des résultats remontés.

Installation du moteur d'indexation swish-e

Le moteur d'indexation « Swish-e » doit être installé sur le serveur hébergeant OVIDENTIA..

Swish-e peut être téléchargé depuis le site : http://swish-e.org

Nous vous invitons à utiliser la documentation d'installation et de configuration présent sur le site de Swish-e pour son intégration sur votre serveur. http://swish-e.org/docs/index.html



Configuration du connecteur Swish-e dans OVIDENTIA.

Cette étape ne doit être réalisée qu'après l'installation de Swish-e sur votre environnement. Pour activer la configuration du moteur d'indexation dans OVIDENTIA., il faut ajouter la ligne suivante dans le fichier config.php qui se trouve à la racine d'OVIDENTIA. (à placer avant la balise « ?> » ) :

<source lang="php">

$babSearchEngine = 'swish';

</source>


L'accès à la configuration du connecteur Swish-e dans OVIDENTIA. s'effectue en tant qu'administrateur du portail. Depuis la section « Administration », cliquer sur «sites» puis sur le nom de votre site. En sélectionnant «Configuration du moteur de recherche», Il est nécessaire de renseigner le chemin complet d'accès aux exécutables.



Exemple dans un environnement Windows

Commande swish-e (swish-e.exe) C:\Progra~1\SWISH-E\swish-e.exe
Commande pour transformer les documents pdf en texte (pdftotext.exe) C:\Progra~1\SWISH-E\lib\swish-e\pdftotext.exe
Commande pour transformer les documents word en texte (catdoc.exe) C:/Progra~1/SWISH-E/lib/swish-e/catdoc.exe
... ...

.... Attention : Les noms longs ne sont pas supportés, dans notre exemple C:\Program Files devient C:\Progra~1.

Exemple dans un environnement Linux

Dans un environnement linux, la configuration est détectée automatiquement si elle n'est pas renseignée depuis la version 6.6.90 d'Ovidentia. Les emplacements exacts peuvent être saisis pour améliorer les performances ou si les executables sont placé dans des répertoires non reconnus par le système (par la commande whereis)


A noté :

Pour que Ovidentia « communique » avec Swish-e, il est nécessaire que l'utilisateur qui exécute le serveur web (Apache, IUSR_NomDuServeur ...) puissent demander l'exécution de Swish-e. Dans un environnement IIS 6/Windows 2003 SRV, il est nécessaire de mettre le droit de lecture/exécution au fichier "cmd.exe" qui se trouve dans "windows/system32" pour l'utilisateur IUSR_NomDuServeur.



Utiliser l'indexation dans un module

...


Indexation planifiée

Rajouter &prepare=1 dans les url d'indexation.

Le script génère un fichier .bat pour l'execution.

Les appels du système vers ovidentia se font par défaut au travers de wget, il est possible de modifier l'outil utilisé, exemple avec curl, ligne à ajouter dans config.php :

define('BAB_SWISHE_WGET_URL', 'curl %s > /dev/null 2>&1');