intra-mart Accel Platform IM-ContentsSearch for IM-Knowledge 仕様書 初版 2018-12-01

5. ワークブック全文検索機能

IM-Knowledgeに作成されたIM-Spreadsheetのスプレッドシート(ワークブック)の全文検索機能に関する仕様について説明します。

5.1. ワークブッククローラ

ワークブックのクローリング処理を行うジョブです。

最終クロール日時保存場所

ワークブッククローラは最終クロール日時をPublicStorageの以下のファイルに保存します。

<%PUBLIC_STORAGE_PATH%/products/im_contents_search/store/%テナントID%/last_crawling_date/imkb$spread.json>

5.1.1. 差分クローリング

差分クローリング時の登録・更新対象

差分クローリング実行時にコンテンツの登録・更新の対象となるワークブックの条件は以下の通りです。
最終クロール日時以降で以下のいずれかの条件を1つ以上満たすワークブックについて、コンテンツの登録または更新処理が実行されます。
  • 条件1 : 新たに登録されたワークブック
  • 条件2 : 更新されたワークブック
  • 条件3 : 削除されたワークブック
  • 条件4 : タグが付与されたワークブック
  • 条件5 : タグが更新されたワークブック
  • 条件6 : ナレッジグループが更新されたワークブック

5.1.2. 削除クローリング

ワークブッククローラが作成したコンテンツをすべて削除します。
また、最終クロール日時を “1970-01-01 00:00:00” に初期化して保存します。

5.1.3. 再作成クローリング

ワークブッククローラが作成したコンテンツをすべて削除し、作成対象のワークブックのコンテンツを再度登録します。

5.2. コンテンツ作成対象

ワークブッククローラはすべてのワークブックがコンテンツ作成対象です。
ワークブック1つごとにインデックスを作成します。

注意

ワークブッククローラが作成するコンテンツはIM-Knowledgeのナレッジコンテンツとして保存されているワークブックが対象です。
SpreadJS(Spread.Sheets、Spread.Views)を利用して作成したアプリケーション上のデータは、ワークブッククローラが作成するコンテンツに含まれません。

5.3. コンテンツの情報

ワークブッククローラではワークブック情報を以下の内容で登録します。

5.3.1. 標準フィールド

No フィールド名 設定値 備考
1 ID imkb_%ワークブックID% コンテンツを一意に識別するIDです。
2 TYPE
imkb
imkb$spread
imkb$spread$%ナレッジグループID%
コンテンツのタイプです。
3 URL knowledge/contents/spreadsheet/%ワークブックID% ワークブック表示画面のURLです。
4 ID_ORIGINAL ワークブックID コンテンツの元データにおける一意なキーとなるIDです。
5 TITLE ワークブックタイトル コンテンツのタイトルです。
6 TEXT
シート名
セル内の文字列
コンテンツの主となるテキストデータです。
7 ATTACHMENT -  
8 RECORD_DATE ワークブック最終更新日時  

コラム

タイトル(TITLE)、テキスト(TEXT)、添付ファイル(ATTACHMENT)に登録した内容が検索時に検索対象となるフィールドです。

注意

検索対象となるセルの文字列について

セル内の文字列はコンテンツ作成対象(全文検索対象)ですが、書式設定を変更しているセルは変換前の文字列が検索対象となる場合があります。

5.3.2. 動的フィールド

No フィールド名 設定値 備考
1 GROUP_DESCRIPTION_STRING ナレッジグループ説明 JSON形式、多言語情報
2 GROUP_NAME_STRING ナレッジグループ名 JSON形式、多言語情報
3 CREATE_USER_CD_STRING ワークブック作成ユーザコード  
4 CREATE_USER_NAME_STRING ワークブック作成ユーザ名  
5 CREATE_DATE_DATE ワークブック作成日時  
6 RECORD_USER_CD_STRING ワークブック最終更新ユーザコード  
7 RECORD_USER_NAME_STRING ワークブック最終更新ユーザ名  
8 CONTENTS_DESCRIPTION_STRING ワークブック説明  
9 CONTENTS_COMMENT_STRING ワークブック更新コメント  
10 LATEST_VERSION_INTEGER ワークブックの最終更新バージョン番号  
11 FORMAT_TYPE_STRING ワークブックのテキスト形式  
12 TAG_STRING_MLT タグ情報 JSON形式

5.4. ファセット

ワークブッククローラではコンテンツ作成時に以下のファセット分類を適用しています。

ワークブック

ワークブッククローラで作成されたすべてのコンテンツに対して「ワークブック」というファセットを適用します。

ナレッジグループ名

ワークブック」のファセットを適用したコンテンツに対して、更にナレッジグループ名のファセットを適用します。

コラム

ワークブッククローラが全文検索画面に提供するファセットナビゲーションの例

全文検索画面の検索結果にワークブッククローラのコンテンツがある場合、以下の様なファセットナビゲーションが全文検索画面の左部に表示されます。
リンクを選択することで検索結果の絞込み検索を行うことができます。
../../_images/facet1.png

5.5. 閲覧可能権限

作成されたコンテンツの閲覧を許可する権限は、ナレッジグループに設定されているアクセス権と同じ権限が適用されます。
ユーザが検索を実行したときに検索対象となるワークブックは、そのユーザに許可されているナレッジグループのアクセス権で「管理」・「編集」・「参照」のいずれかが許可されているナレッジグループのワークブックです。

5.6. 検索結果表示項目

ワークブッククローラが作成したコンテンツの検索結果で全文検索画面に表示されるコンテンツの表示項目は以下です。

  • タイトル(ワークブックタイトル)
  • ワークブック最終更新日時
  • ナレッジグループ名
  • ナレッジグループ説明
  • ワークブック作成者名
  • ワークブック更新者名
  • コンテンツに付与されているタグ名

検索結果画面例

../../_images/search_result1.png

コラム

検索結果のタイトルリンクをクリックすると、新しいウィンドウで「ワークブック表示」画面を表示します。

../../_images/view1.png