Researchmap利用者マニュアル/研究者用/登録、更新/業績/業績の類似チェック

提供:researchmap guide

2019年12月13日 (金) 15:31時点におけるSiteAdmin (トーク | 投稿記録)による版 (→‎2.類似チェック内容)

業績の類似チェック

researchmapでは業績の重複登録を避けるため、新しく業績を登録または追加する際にその業績が既に登録されているかチェックを行っています。


類似チェックはすべての業績で行います。

  • 画面からの入力
  • 外部システムからのデータ取り込み
  • インポート
  • API


※APIは機関事務担当者の更新方法です。

類似の指定方法、より詳細な動作についてはAPI設計書を参照してください。

また、類似チェックは業績の画面表示言語(日、英)にかかわらず行います。


1.類似チェック時の動作

画面からの入力時、外部システムからのデータ取り込み時、インポート・APIによる入力時それぞれで動作が異なります。


画面からの入力時

業績入力後に類似チェックが行われ、既登録データに類似が見つかった場合には、下記の登録方法を選択することができます。


業績の類似チェック 登録方法


入力データを主にマージ
類似データ(既登録データ)を入力データで上書きして更新
類似データを主にマージ
類似データ(既登録データ)を優先して、既登録データにない情報を入力データで保管し更新
入力データを強制追加
類似データ(既登録データ)を無視して、強制的に入力データを新規登録

外部システムからのデータ取り込み時

外部システムからのデータ取り込み時に既登録データで類似が見つかった場合は、外部システムから取り込んだデータを主に、既登録データにないデータを補完して更新します。



インポート・APIによる入力時

データ入力時に以下の更新方法のいずれかを指定して登録します。


強制追加
類似チェックは行わず、インポートしたファイルの業績を新規登録
登録(入力データ優先)
入力データを優先して既登録データにない情報を補完して更新
登録(類似データ優先)
類似データ(既登録データ)があった場合、類似データを優先して更新
登録(追加・更新)
類似データがあった場合にはエラーとし、類似データがなければ新規登録。APIは業績IDを指定した場合、入力データ優先で更新。



2.類似チェック内容

類似チェック判定内容は以下の通りです。 特に指定がない限り、複数の類似条件のすべてを満たす場合に類似とみなされます。 また、空の(情報がない)項目はチェック対象としません。 重複がなければそのまま更新されますが、重複がある場合はメッセージが表示されます。




※共通変換処理 入力データと既登録データを共に変換し、類似チェックを行います。 変換処理内容は以下の通りです。


  • 全角ひらがな、半角カナを、全角カナに変換します。
  • 全角英数字記号を半角英数字記号に変換します。
  • 以下の環境依存のフォントによる数字を半角数字に変換します。
環境依存数字


  • 全角スペースを半角スペースに変換します。
  • 複数の連続した半角スペースを1つのスペースに変換します。
  • 前後(頭、末尾)の半角スペースを取り除きます。
  • 文末が以下の括弧で囲われていた場合、括弧内の文字中の数値以外の文字を取り除きま
  • す。
    • ( )
    • [ ]
    • { }
    • 「 」
  • 「ッ」、「ュ」、「ィ」の文字列は除去します。
  • 以下の記号を残して、それ以外の記号を除去します。
除去記号


ここからは以下を例に、類似チェック後の確認、更新方法について説明します。

更新方法新方法:画面から新規登録

更新する業績:講演・口頭発表等

講演・口頭発表等の類似チェックの条件:

講演口頭発表等の類似チェック項目