import sys
sys.path.append("./src")
from agbert import EnBertEmb, JaBertEmb
#オブジェクトの初期化
EBE = EnBertEmb()
#文字列リストの用意
docs = ["I ate an apple",
"You ate a banana",
"Ukrainian ambushed on Russian tanks",
"Drone footage shows Russian tank column retreat after artillery",
"GNU is not unix",
"Who are you?",
"Where you are?"
]
#文書の登録
matrix = EBE.register(docs)
#類似分検索
EBE.similardoc(docs[3])
#計算済み特徴量(行列)&文書の保存
EBE.save()
#計算済み特徴量(行列)&文書の読み込み
EBE.load()
#オブジェクトの初期化
JBE = JaBertEmb()
#文字列リストの用意
docs = ["向こうの店のほうが安いからこっちでは買わない。",
"この店は良い品を置いている。",
"ここで売っている物は質がいい。",
"自然言語処理系のお仕事の報酬は最低賃金以下だから労働基準法に触れるかもしれない。",
"開会式で大声出して暴れたら、民法90条の公序良俗関係で訴えられるかも",
"自動運転車が天下一品の看板を赤信号と認識して道路交通法違反となる可能性がある。",
"アメリカの法律と日本の法律は違うのか。",
"郷に入っては郷に従え",
"長いものに巻かれる",
"出る杭は伸ばす"
]
#文書の登録
matrix = JBE.register(docs)
#類似分検索
JBE.similardoc(docs[3])
#計算済み特徴量(行列)&文書の保存
JBE.save()
#計算済み特徴量(行列)&文書の読み込み
JBE.load()