Hellwig’s Devanagari OCR

Batch Sanskrit OCR (1.0.0.9 beta)

1) Every document is [New Document*]. In the File Menu I see «Open» and «New» stack file. Where is Save?
2) As before zoom between different pages is lost.
3) A RegEx after recognition cleanup would be a good idea.
।। ६ई४ए ।। If you have at least a single number between two double dandas, it means nothing else can be there than just one or several more numbers. ई and ए — dirt. Very many same similar elementary to fix issues like ।। ६ई३ ।।, ।। ६ई७ ।। , ।। ६इ६इ ।1 If all shlokas have 2 numbers there is a good chance that a 3 number shloka in the middle is just junk.

4) One can’t copy any selected words from the «Recognized text» box on the lower side of the window. I have to press «Save recognized text», choose «Copy to clipboard» and press «Save!» instead of a single copy paste as in MS Office documents.

5) Do not try to recognize text above or bellow lines. सष००प्त०ण्ण००स०ष is better left as Introduction.

Video: http://youtu.be/4adQMnLgUeE

Specimens:

https://www.dropbox.com/s/445y04pnvl1ff1o/HOSv14-noOCR.pdf 6 Mb
https://www.dropbox.com/s/olm1u5sejhub25j/HOSv14-OCR.pdf 22.7 Mb

??

???? ????? तन्मादृणनां किं नाम तदरं स्यात् ० यस्य स्यादीदृशः फलवि- पाकः ० यत्सततं देहीति वक्ति । तत्सर्वथा धनहीनस्य ममाधुना ० नेह श्रेयः । उक्तं च ।

वसेन्मानाधिकं स्थानं मानहीनं न संवसेत् ।

मानहीनं सुरैः सार्ध विमानमपि वर्जयेत् ।। ६ई३ ।।

6 एवमुत्वाप्यहं पुनरप्येवमचिन्तयम् । किमर्थितां कस्यचित्क- रोमि । तदेतत्कष्टतरम् । यत्कारणम् ०

 

कुच्चस्य कीटखातस्य दावनिष्कुषितत्वचः ।

9 तरोरप्यूषरस्यस्य वर जन्म न चार्थिनः ।। ६ई४ए ।।

कखे गद्गदता स्वेदो मुखे वैवर्ण्यवेपथ ।

म्रियमाणस्य ओचहानि यानि तान्येव याचतः ।। ६इभ ।। तदर्थित्वमपि जघन्यम् ।

वैराग्याहरणं धियो ऽपहरणं मिष्याविकल्पास्पदं

पर्यायो मरणस्य दैन्यवसतिः शङ्कानिधानं परम् ।

 

1६ ८र जाघवमास्पद च ??? माानना-

मर्थित्वं हि मनस्विनां न नरकात्पश्यामि वस्त्वन्तरम् ।। ६इ६इ ।1 अपि च ।

18 निर्द्रव्यो हियमेति दीपरिगतः प्रभ्रश्यते तेजसो

निस्तेजाः परिभूयते परिभवाविर्वेदमागच्छति ।

निर्विण्णः षुचमेति शोकमनसो बुद्धिः परिभ्रश्यति

21 निर्धीकः क्षयमेत्यहो निधनता सर्वापदामास्पदम् ।। ६ई७ ।। —

आप च ।

वरमहिमुखे क्रोधाविष्टे करौ विनिवेशितौ

91 विषमपि वर पीत्वा सुप्तं यमस्य निवेशने ।

 

If not enough memory
1) give a chance to get back, like in SEO Frog
2) cancel is not working in «Exporting pdf document» after Out of memory OK pressed. It cancels only 2-4 minutes after pressing. 1.2 RAM is used when software working.
3) Rotate by 180 — no batch function. The OCR turned 180 all my scans and I can not fix it. Why now and not before — no idea. The first page was all ok. Why did it started to turn them around — who knows?
4) If recognition failed, and I create a new stack file (to save the current one), no save button is offered. So even the last and only way to save a file is lost.