Bug 7698: Add CHR/ICU Zebra tokenization choice to installation
authorFrédéric Demians <f.demians@tamil.fr>
Mon, 12 Dec 2011 08:39:34 +0000 (09:39 +0100)
committerPaul Poulain <paul.poulain@biblibre.com>
Tue, 13 Mar 2012 15:08:04 +0000 (16:08 +0100)
commita0316d4d272c585d8d52672166d64963f83ec64a
tree7785354b8b918280df1a1cf7cbcbd4e56f9bad73
parenta5e6f107eeb33f3576165dadf28ab0373c71e5ee
Bug 7698: Add CHR/ICU Zebra tokenization choice to installation

Word search with multi-part facets works properly only with Zebra ICU
tokenization. This patch add a new question to Koha command line
installer:

  Zebra has two methods to perform records tokenization
  and characters normalization: CHR and ICU. ICU is
  recommended for catalogs containing non-Latin
  characters. (chr, icu) [chr]

How to test:

  - perl ./Makefile.PL
  - Try each possible value for new parameter
  - Take a look at zebradb/etc/default.idx file.
    Depending of the parameter you get this line:
      icuchain words-icu.xml
    or this one:
      charmap word-phrase-utf.chr

Signed-off-by: Jared Camins-Esakov <jcamins@cpbibliography.com>
(Note: This patch was previously associated with bug 3216; I moved it to a
separate bug because including ICU is a good idea independent of the fix for
the particular issue described in bug 3216)

Signed-off-by: Paul Poulain <paul.poulain@biblibre.com>
Makefile.PL
etc/zebradb/etc/default.idx
etc/zebradb/etc/words-icu.xml [new file with mode: 0644]
rewrite-config.PL