Skip to content

MVP распознавателя действий над реактивами

License

Notifications You must be signed in to change notification settings

xlab-it/usages-detector

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Зависимости

pip install Flask
pip install -U pip setuptools wheel
pip install -U spacy
python -m spacy download ru_core_news_sm

Демо

Что можно улучшить?

  • Сопоставление слов. Параметр threshold не очень честно работает для слов, которые при склонении сильно трансформируются.
  • То есть поиск реактивов вместо использования базы знаний сделать с использованием именованных сущностей. Это решит проблемы вроде следующей:

    Токен концентрированной должен ассоциироваться с -> концентрированная серная кислота, однако этого не происходит и сущность не учитывается.

  • Можно компенсировать с использованием раскрутки вниз - рассмотрения всех связанных слов. Например фенил -> [child] магний -> [child] бромид.
  • Добавить обработку конъюнкций добавляем реактив1, реактив2.
  • Связь добавляем реактив (9 мл) распознается как parataxis. Исследовать, насколько это уместно.
  • Процессинг кореферентных выражений

About

MVP распознавателя действий над реактивами

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published