TextDiff Comparsion Between Sorting

Let me continue https://samskrtam.ru/textdiff-dictionary/ — comparing of headwords in Sanskrit dictionaries with NLP tools.
Difference between «perfect» devanagari sorting and «usual» Indian sorting is quite huge. Out of 43142 lines 12062 where changed in http://www.sanskrit-lexicon.uni-koeln.de/scans/SHSScan/2014/web/index.php How can one find a word if one does not where to look for 1/3 of entries?

Додуманная автобиография

Я помню себя с тех пор, как появился у мамы в животе. Даже раньше, когда головастиком пытался избавиться от хвоста или же хобота. Зависит от того, с какой стороны подходить к вопросу о моем предназначении. Как я оказался на этой планете, не помню. Было ли это до или после потопа ведомо только царю Ашшурбанипалу, у которого картотека всех дел на Земле. Картотека, которая, насколько мне известно по лекциям ИДЦ, перешла к проф. И.А. Гвоздевой. Ровно двадцать два с половиной года тому назад меня, подобно еврейскому парнишке Иову выплюнул на сушу чудо-юдо-рыба-кит.

Я сначала не хотел включать сюда цифр, но взрослые считают, что это придает работе серьезность. Я устал спорить со взрослыми, поэтому добавлю некоторые хронологические сведения и данные статистики, если представится такая возможность.

Ни роду, не племени, ни карточки медицинского страхования. Был летний день 1983-го года в Латвийской ССР, 27-го августа в городе Уогре, без десяти шесть утра. Как раз в это время проиграли по радио гимн. Кто-то в этот момент переливал вскипяченное молоко. А кто-то, быть может, на другом континенте провалил экзамен.

В списках числится старший брат и младшая сестра. Я – средний.

В середине 2001 г. закончил без отличия и средств на пропитание Уогрскую гимназию, в которой я, к великому сожалению для себя, весьма бесполезно провел три года. В том же году поступил на отделение английской филологии (факультет Современных языков) при Госуниверситете Латвии, но в скором времени покинул Ригу и покинул ее навсегда.

В 2002 г., на втором семестре, перевелся в Литинститут, в семинар прозы С.Н. Есина и на недолгое время стал самым молодым семинаристом. Семинар научил меня одной, двум, но важным истинам. Вторая из них гласила, что научить можно только тому, как не надо, а как надо знаешь только ты сам. О первой истине – умолчу, иначе все узнают и станут писать исключительно хорошо.

Творческий семинар, впрочем, как и семинар поэта Е.Б. Рейна и семинар по детской литературе Р.С. Сефа, я посещал исправно четыре года.

В 2003-ем году состоялась моя первая публикация и была она на русском языке к великому удивлению моей всегда строгой ко мне Нины Васильевны Федоровны, ведь русскому языку я раньше не учился и разговаривал в семье на латышском. Я еще не волшебник, я только учусь.

На 4-ом курсе я сделал для себя открытие. Во всех анкетах до этого я последовательно проставлял черточку напротив факультета: не знал какой точно у нас факультет, специалист и все.

Ну так вот, на четвертом курсе я впервые столкнулся с двойственностью мира. Отдельное расписание для переводчиков и так же отдельное расписание для факультета художественного творчества пошатнуло мои устои. Дуальность во всем.

Хотя это, скажу откровенно, ничто по сравнению с затруднением, какое возникает при перечислении иностранных языков, которыми я когда-либо пытался овладеть.

Особенно стыдно за плохое владение французским. Конечно, среди моих знакомых найдутся такие, которым также неведомы и тонкости греческих диалектов, но, поверьте, таких меньшинство. Говорят, что мой латышский выветрился. Далайлама (не вспомню какой по счету) при встрече со мной в Риге молвил, что мой тибетский еще не достаточно закрепился, хромает фразеология. Решил подучить берберский, на нем говорил всего один человек где-то в лесах Амазоны, однако я успел попасть на кремацию этого старика, опоздав всего на несколько часов. По тому, что я прочел в его глазах, я составил словарь двухтомник и монографию по сочетаемости фонем берберского языка. Немецкий я знал с детства, английский выучил по фильмам, хотя год застревал на слове hedgehog[1]. Пять табличек в автобусе из Амстердама хватило, чтобы, чуть подпортив немецкий, выучить датский. Подучил санскрит и через семестр сдал экзамен по какой-то Ригведе, но теперь переметнулся на древнеперсидские наскальные надписи. Акад. А.А. Зализняк настаивал на тохарском Б и твердил о всяческой полезности хеттского еще в позапрошлом году, когда я показал ему свою тройку по старославянскому. Египетский можно вычеркнуть, потому что его в университете учил мой кровный брат, а мы одна семья.

Кроме трех искусственных языков, совершенно случайно выучил аккадский и шумерский. Когда присмотрелся оказалось, что это один и тот же язык, а сразу так даже и не скажешь: справа строчка, слева строчка. Вам тяжело перечислить эти 23 языка, а мне пришлось их выучить. Когда листал Тору, на третьем году обучения, на последней странице я прочел строчку, которая меня сразила, а я всегда читаю честно: от корочки до корочки. Так вот, там написано, но написано-то на последней странице: „Читать слева на право“. Пока не хватает двадцати девяти из сорока языков, которым следовало бы овладеть. Меньше двадцати знать неприлично, просто неприлично.

Я вообще большой любитель почитать. Если где-нибудь бесплатно раздают газеты, я беру сразу пачками: хорошей литературы никогда не может быть слишком много. Например «Московский литератор» у нас в институте прямо перед туалетом лежит на сломанном стуле.

Люблю лежать голый в предбаннике и в фуфайке в снегу. Плавать и, одновременно, писать в море или в душе бассейна – потом тепло в плавках и селедка всплывает брюхом вверх.

Сыпнуть цианистого калия в нору крота. Поделить ровно арбуз. Целовать подругу с молочной конфетой в ухо или когда у нее скользкая, намасленная кожа на животе.

Ковырять в носу в Эрмитаже и пукнуть там, где это не оговорено этикетом. Наливать молоко из трехлитровой банки в кружку, не пролив ни капельки.

Люблю творог с медом и пресвятую деву Марию. А еще вишни без косточек и, когда не напоминают о том, что я иной: гость я, гость на планете Земля.

Топить дохлых мышей в унитазе и смотреть, как их засасывает воронкой. Прыгать с парашютом, хотя никогда этого не совершал. Пить грейпфрутовый сок, заедая красной икрой (хотя по моему это уже было). Лежать на теплой русской печке и покачивать левой ногой.

Птичье молоко в шоколадной глазури. Распевать на Ганге ранним утром мантры. Люблю крабов, раков и салат из креветок и из прочих гадов.

Смотреть на косяк журавлей осенью над стогом сена и на подснежники ранней весной. Не вынимать чайную ложку из чая и запах сушеных яблок.

Ехать на велосипеде, отпустив руль.

В начале 2004 г. был принят на Юношеское и детское отделение Московской городской организации Союза Писателей России. В том же году принят в Общество Востоковедов при Российской Академии Наук. Волей судеб в конце того же года поехал на Всеиндийскую конференцию востоковедов, в один из семи священных городов Индии — Варанаси и провел там две недели.

В позапрошлом году женился на прекрасной пианистке по имени Александра. Остальное пока не удалось выяснить, потому что у нее прекрасные синие глаза, но это уже совершенно другая история.

Кроме публикаций 1) рукописных 2) на иврите 3) в сборниках научных конференций (по индологии, по истории языкознания, по историографии санскритологии в России, по компьютерной лексикографии) 4) посвященных жене, они не всегда носят художественный характер. Например, учебник классического санскрита. А также печатался:

рецензия «География таинственных мест. Карта прилагается» на книгу «Путешествие в Шамбалу». Журнал «Дружба Народов», № 12 за 2003 г.;

два кратких рассказа в «Аудитория 24: Сборник стихотворений студентов Литературного института им. М. Горького и студии МГУ И.Л. Волгина «Луч», 2004 г.;

очерк путешествия в ежедневной газете «Lauku Avize» („Сельская газета“) на латыш. яз., 26-го марта 2004 г.;

журнальный вариант рассказа «Крылатый карп и ныряющие канарейки» в альманахе «Отечество», рубрика «Новая литература», № 9 за 2004 г., с. 25;

перевод индийского средневекового поэта Кабира на латышский язык, литературный журнал «Karogs» („Флаг“), №4 за 2005 г.;

журнальный вариант рассказа «Ушанка, пальто и планшет» в альманахе «Отечество», рубрика «Архив», № 8 за 2005 г.

[1] (англ.) Ёж (Erinaceus europaeus)

EmEditor Devanagari Transliteration Converters

Конвертер деванагари (EmEditor)

devanagari-transliteration

Комбинируя разные макросы, можно сконвертировать с чего угодно на что угодно. Туда и обратно.

bayaryn@gmail.com — автор скриптов, санскритолог-филолог (Минск)
gasyoun@ya.ru — автор идеи и охранитель скриптового очага (Краснодар)

Например:

. mak›{fey %vac.
z&[u rajNkulôI[a< mha-aGy< yuixiór,
svRmet*wa àaÝ< saivÈya rajkNyya. 1.
AasINmÔe;u mhaTma raja prmxaimRk>,
äü{yí zr{yí sTys<xae ijteiNÔy>. 2.
yJva danpitdR]> paErjanpdiày>,
paiwRvae =ñpitnRam svR-Utihte rt>. 3.
]mavannpTyí sTyvaNs<yteiNÔy>,
Ait³aNten vysa s<tapmupjiGmvan!. 4.

  • В Unicode деванагари. Не нужно устанавливать специальный шрифт, можно передавать в скайпе или разместить в интернете — единстенное лигатуры могут искажаться из-за шрифта Mangal, но это только видимость.

॥ मार्कण्डेय उवाच॥
शृणु राजन्कुलस्त्रीणां महाभाग्यं युधिष्ठिर।
सर्वमेतद्यथा प्राप्तं सावित्र्या राजकन्यया॥ १॥
आसीन्मद्रेषु महात्मा राजा परमधार्मिकः।
ब्रह्मण्यश्च शरण्यश्च सत्यसंधो जितेन्द्रियः॥ २॥
यज्वा दानपतिर्दक्षः पौरजानपदप्रियः।
पार्थिवो ऽश्वपतिर्नाम सर्वभूतहिते रतः॥ ३॥
क्षमावाननपत्यश्च सत्यवान्संयतेन्द्रियः।
अतिक्रान्तेन वयसा संतापमुपजग्मिवान्॥ ४॥

  • dev2trans — переводим из юникодного деванагари в академический латинский транслит

|| mārkaṇḍeya uvāca||
śṛṇu rājankulastrīṇāṃ mahābhāgyaṃ yudhiṣṭhira|
sarvametadyathā prāptaṃ sāvitryā rājakanyayā|| 1||
āsīnmadreṣu mahātmā rājā paramadhārmikaḥ|
brahmaṇyaśca śaraṇyaśca satyasaṃdho jitendriyaḥ|| 2||
yajvā dānapatirdakṣaḥ paurajānapadapriyaḥ|
pārthivo ‘śvapatirnāma sarvabhūtahite rataḥ|| 3||
kṣamāvānanapatyaśca satyavānsaṃyatendriyaḥ|
atikrāntena vayasā saṃtāpamupajagmivān|| 4||

  • IAST_SLP1 — для разных манипуляций на компьютере, где доступна только обычная QWERTY клавиатура можно использовать транслитерацию SLP1, в которой каждый слог (знак) отображается одной условной буквой (включая дифтонги и придихательные)

|| mArkaRqeya uvAca||
SfRu rAjankulastrIRAM mahABAgyaM yuDizWira|
sarvametadyaTA prAptaM sAvitryA rAjakanyayA|| 1||
AsInmadrezu mahAtmA rAjA paramaDArmikaH|
brahmaRyaSca SaraRyaSca satyasaMDo jitendriyaH|| 2||
yajvA dAnapatirdakzaH pOrajAnapadapriyaH|
pArTivo ‘SvapatirnAma sarvaBUtahite rataH|| 3||
kzamAvAnanapatyaSca satyavAnsaMyatendriyaH|
atikrAntena vayasA saMtApamupajagmivAn|| 4||

  • Все то же самое есть и в MS Word. Текстовый редактор удобен при больших объемах или там, где не имеет значение разметка и оформление.