検索単位
KAKENのシステムでは、同じ文字種の連続を「単語」として切り出し、単語単位で検索する文字種と文字単位で検索する文字種があります。
単語単位で検索する文字種は次のとおりです。
日本語 | 促音拗音は通常の大きな文字とみなします。ひらがなカタカナの違いは無視します。 |
英数字 | 大文字小文字、全角半角の違いは無視します。 |
記号類 | 全角半角の違いは無視します。(一部例外があります)長音(-)と半角ハイフン(-)は除去されます。 |
文字単位で検索する文字種は次のとおりです。
ひらがな、カタカナ、漢字 ハングル |
AND 検索
空白を挟んで単語を並べた検索文字列は「AND検索」とみなします。語順の異なるレコードも適合とみなします。
例
検索文字列 | レコード | 適合 | |
---|---|---|---|
Computer Science | computer science | ○ | |
science computer | ○ | ||
science of computer | ○ | ||
computer-science | ○ | ||
computer sciences | × | 単語単位で一致を検証するため |
単語の間に大文字でANDと記述することで、AND検索を明示できます。
単語の先頭に「+」を置いても、AND検索とは解釈しません。
例
検索文字列 | レコード | 適合 | |
---|---|---|---|
+computer | +computer | ○ | |
#computer | × | 記号が一致しないため | |
computer | × | 記号が存在しないため |
フレーズ検索
語順まで一致させて検索する場合は、「"(半角二重引用符)」で囲む「フレーズ検索」を使用します。
例
検索文字列 | レコード | 適合 | |
---|---|---|---|
"Computer Science" | computer science | ○ | |
science computer | × | 語順が異なるため | |
science of computer | × | 間に別の単語を含むため | |
computer-science | × | 間に記号「-」を含むため |
前方一致検索
単語の末尾変化を許容する検索は、単語末尾に「*(半角アスタリスク)」を置く「前方一致検索」を使用します。
例
検索文字列 | レコード | 適合 | |
---|---|---|---|
mak* | mak | ○ | |
make | ○ | ||
making | ○ | ||
made | × | ||
remake | × | 単語の頭が異なるため |
後方一致検索
単語の後方一致検索には対応しません。
中間一致検索
単語の中間一致検索には対応しません。
人名の完全一致
人名の検索フィールドで、「山田一」だけ適合して「山田一郎」は除外したい場合、姓名の間にスペースなしでフルネーム(「山田一」)を入力すると完全一致で検索できます。姓名の間にスペースがある場合は「山田」と「一」を含む研究者が検索されます。
例
検索文字列 | レコード | 適合 |
---|---|---|
山田一 | 山田一 | ○ |
山田一郎 | × |
OR 検索
単語の間に大文字でORと記述することで、「OR検索」を使用できます。
例
検索文字列 | レコード | 適合 |
---|---|---|
Computer OR Science | computer science | ○ |
science | ○ | |
computer | ○ |
ANDとORを並列した場合、左に書かれている論理演算子から優先されます。
例
検索文字列 | レコード | 適合 | |
---|---|---|---|
red AND blue OR green | red blue | ○ | (red AND blue) OR greenと解釈するため |
blue | × |
否定
特定の単語を含まないレコードを検索するためには、単語の前に大文字で「NOT(空白)」を置きます。
例
検索文字列 | レコード | 適合 | |
---|---|---|---|
gnu NOT unix | gnu | ○ | |
gnu unix | × | ||
linux | × | gnuが含まれていないため |
括弧を使った演算
括弧を使った演算には対応しません。括弧がある場合、括弧は演算子ではなく文字として扱われ、左に書かれている論理演算子から優先されます。