<div dir="ltr"><div dir="ltr"></div><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:Verdana;font-size:12px"><div>
<div>All this gets me no nearer configuring Xsane. Is anybody listening there on sane-devel? Do you guys not know? I'm one step short of downloading source and grepping it!</div></div></div></div></blockquote><div></div><div><br></div><div>Feel free to download and grep.<br></div><div><br></div><div>But as far as I know, xsane does not integrate any OCR. gscan2pdf, recommended previously by Jeff, does. It allows you to work on and reorganize individual scanned pages and turn them into multi-page pdfs, with or without OCR'ed text. Quite frankly one of the best tools I ever used. I did hundreds of pages with it.<br></div><div> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:Verdana;font-size:12px"><div>

<div> </div>

<div>gscan2pdf, eh?</div>

<div>That sounds like a gnome thing, doesn't it? Gnome I don't remember well. I'm on Slackware64 here, and you're probably developing it under a gnome shell. I'll happily try it out and compare it, but you'll have to spoonfeed me on the dependencies. Slackwasre64 supports kde, & XFCE. I'm using xfce.</div></div></div></div></blockquote><div><br></div><div>It's current version 2.5.5 is GTK3 based. I tried it for you on openSUSE Plasma (KDE) with tesseract. Builds and works fine, but requires a significant number of Perl libraries. Clone it from git, run 'perl Makefile.PL' and observe what is missing. Then make, install and run it to see additional missing packages. None of it is problematic.<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:Verdana;font-size:12px"><div>

<div>Could you post the output of 'ldd /path/to/gscan2pdf' please? I'll get an idea of how much hassle I'm in for. I'm hoping for a short output, not a long one.</div></div></div></div></blockquote><div><br></div><div>Sure:</div><div><br></div><div>$ ldd $(which gscan2pdf)<br>        not a dynamic executable</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:Verdana;font-size:12px"><div>

<div> </div>

<div> 
<div name="quote" style="margin:10px 5px 5px 10px;padding:10px 0px 10px 10px;border-left:2px solid rgb(195,217,229)">
<div style="margin:0px 0px 10px"><b>Sent:</b> Sunday, July 28, 2019 at 10:09 AM<br>
<b>From:</b> "Jeff" <<a href="mailto:jffry@posteo.net" target="_blank">jffry@posteo.net</a>><br>
<b>To:</b> <a href="mailto:sane-devel@alioth-lists.debian.net" target="_blank">sane-devel@alioth-lists.debian.net</a><br>
<b>Subject:</b> Re: [sane-devel] Configuring OCR tool</div>

<div name="quoted-content">On 26/07/2019 16:16, Business Kid wrote:<br>
> I have sane(1.0.27) & xsane(0.999) working here on my HP LaserJet MFP<br>
> 130nw Multifunction printer. I wanted to use it for OCR (At which I have<br>
> some commercial experience). gocr seems to be the only OCR tool; but<br>
> that project seems to be dying, or dead.<br>
>  <br>
> This query is about OCR. How do I set the ocr program & options in<br>
> xsane? I would like to be able to choose tesseract, or ABBYY and pass<br>
> options. I think tesseract has a 'stdout' option, which allows you to<br>
> junk the original file. In commercial work, 500G disks were being<br>
> swapped around regularly as they filled up and were queued for OCR.<br>
>  <br>
> I did a test of GPL linux tools a few years back, and *tesseract* came<br>
> out best, with a new OCR engine in Beta. I was able to scan & then edit<br>
> one of my father's plays which had been typewritten for him by a novice<br>
> in the 1960s. He then corrected it by hand. Having done work for a firm<br>
> here 10 years back, I knew that *ABBYY* was probably the best<br>
> (commercial) package, then only available in M$Windoze.  ABBYY now have<br>
> a (commercial) linux package, with a one month free trial :-D.<br>
<br>
I can't help you with xsane, but I can suggest another scanning tool<br>
that supports OCR, in particular tesseract (but I am biased, because I<br>
am the author):<br>
<br>
gscan2pdf<br>
<br>
Regards<br>
<br>
Jeff<br>
<br>
--<br>
sane-devel mailing list: <a href="mailto:sane-devel@alioth-lists.debian.net" target="_blank">sane-devel@alioth-lists.debian.net</a><br>
<a href="https://alioth-lists.debian.net/cgi-bin/mailman/listinfo/sane-devel" target="_blank">https://alioth-lists.debian.net/cgi-bin/mailman/listinfo/sane-devel</a><br>
Unsubscribe: Send mail with subject "unsubscribe your_password"<br>
to <a href="mailto:sane-devel-request@lists.alioth.debian.org" target="_blank">sane-devel-request@lists.alioth.debian.org</a></div>
</div>
</div>
</div></div></div>

-- <br>
sane-devel mailing list: <a href="mailto:sane-devel@alioth-lists.debian.net" target="_blank">sane-devel@alioth-lists.debian.net</a><br>
<a href="https://alioth-lists.debian.net/cgi-bin/mailman/listinfo/sane-devel" rel="noreferrer" target="_blank">https://alioth-lists.debian.net/cgi-bin/mailman/listinfo/sane-devel</a><br>
Unsubscribe: Send mail with subject "unsubscribe your_password"<br>
             to <a href="mailto:sane-devel-request@lists.alioth.debian.org" target="_blank">sane-devel-request@lists.alioth.debian.org</a></blockquote></div></div>