Работа подобного масштаба в индологии проделывается впервые. Согласно классификации Льва Ивановича Скворцова словарь носит экспериментальный характер. Используемое в книге количество источников (порядка тридцати) — редкое явление даже для современных западноевропейских языков. Процедура сопоставления списков слов и выявление явных или косвенных дублей частично впоследствии стала автоматизирована с помощью алгоритма fuzzy. Следует однако отметить, что порой рутинной ручной, порой увлекательной мыслительной работы все же осталось еще предостаточно.
Перед тем, как рассортировать слова, потребовалось получить чистые “входные” списки слов, то есть списки, в которых каждое слово занимает по строчке, без каких-либо дополнительных структурных или принятых в книге типографических ухищрений или сбоев кодировки. Для этого нужно было правильно в частности определить конец заголовка словарной статьи, что в случае, например, отсылочных статьей, порождало не мало проблем.
обычный словарь | обратный словарь |
adruh
āśaya ekavat ghāṭa bhālaka mūḍha haṃsatā |
bhālaka
ghāṭa mūḍha āśaya haṃsatā ekavat adruh |
- M viśastratva
- M śīghrāstratva
- śāstratva
- bhadratva
- vinidratva
- G daridratva
- hāridratva
- samudratva
- rudratva
- S kṣudratva
Скачать .doc http://yadi.sk/d/hYnWsZ4HCoSk4