Полезные ссылки для корпусных лингвистов

Внешнее

  • Оливер создал репозиторий, кода там нет, но регулярно обновляет статьи, есть возможность создавать ветки, в которых, правда, еще не отвечал (c 2018), см. github. Скачать дамп базы 2018.
  • код парсер Оливера + выпарсенные данные на 2017 (без учета обновлений 2019) , см. github, похоже частично устарело после дамп базы 2018.
  • отчеты о плохой работе гулговского OCR, комментарий к каждому плохо распознанному документу подается отдельной веткой. Ежемесячно гугловцы будут его просматрывать начиная с марта 2021 г., см. github.

Наше

  • возродить десктопную словарную оболочку Артема, см. github.
  • параметрический анализ словаря Кочергиной