Skip to content

Latest commit

 

History

History
36 lines (23 loc) · 2.62 KB

format.md

File metadata and controls

36 lines (23 loc) · 2.62 KB

Подробное описание полей разметки

term — слово или выражение (обобщённо «терм»)

Слово или выражение русского языка, для которого приведены значения смысловых проекций.

slice — срез (смысловой аспект, семантическая проекция)

Смысловая проекция.

answerA/probaA, answerB/probaB

Поле Комментарий
answerA предсказание А
probaA уверенность А
answerB предсказание Б
probaB уверенность Б

На выходе модели получаем дискретное распределение над классами в рамках проекции. Публикуются одно или два самых вероятных предсказания. Второе публикуется при условии, что его вероятность не менее половины уверенности первого варианта. Отсутствие второго варианта обозначается пустой строкой, уверенность — 0.

Соответственно сумма probaA и probaB может быть меньше единицы.

hmAnswerA/hmAnswerB, hmRatio

Поле Комментарий
hmAnswerA разметка А
hmAnswerB разметка Б
hmRatio соотношение разметки А/Б

При сведении разметки принцип несколько отличается. После отсечения шума, из предложенных вариантов выбираются два наиболее частотных. Разметка Б публикуется при условии, что её частота не меньше половины от частоты основного варианта. hmRatio — относительная частота первого варианта.

otherRatio — уровень сброса

При разметке всегда оставляется возможность выбрать «другое» или «не знаю». Соотношение количества других вариантов к основным и составляет показатель уровня сброса. При значении выше 0.5 достоверность основного ответа считается сомнительной.