OCR + OpenOffice kontra Microsoft Office





forsoft - 29 Lut 2008 10:59
W zasadzie OpenOffice (OO) jest odpowiednikiem Microsoft Office (MO). Jednak nowsze wersje MO posiadają wbudowaną funkcję OCR, której OO nie posiada.

Zastąpienie MO na polu rozpoznawania tekstów (OCR) za pomocą OO wymaga więc dodatkowego oprogramowania OCR. Na podstawie szybkiego rozpoznania można stwierdzić, że oprogramowanie OCR jest tańsze niż najtańszy pakiet MO. Jeszcze berdziej opłacalny mógłby być zakup skanera z dołączonym oprogramowaniem OCR, gdyż ceny skanerów z oprogramowaniem wydają się być niższe niż ceny licencji na oprogramowanie OCR.

Należałoby jednak uwzględnić także inne czynniki. Integracja OCR z MO jest dalece posunięta. Tak więc obsługa takiego systemu powinna być znacznie prostsza niż innych rozwiązań. Z drugiej strony nie znam oprogramowania OCR potrafiącego dobrze zintegrować się z OO.





Vizzle - 29 Lut 2008 11:21


Na podstawie szybkiego rozpoznania można stwierdzić, że oprogramowanie OCR jest tańsze niż najtańszy pakiet MO.


Chyba powinieneś dodać że jest wręcz darmowe, istnieje przecież otwarte oprogramowanie na tym polu, choćby OOCR. Zatem 0zł za rozwiązanie otwarte, wobec kilkuset za MO.



forsoft - 29 Lut 2008 11:31
No... nie do końca. OOCR jest jeszcze w formie źródłowej. Nie znalazłem skompilowanej użytecznej wersji możliwej do zastosowania w biurze.

Simple OCR jest także darmowy, przy tym jest już skompilowany i gotowy do pracy. Problem w tym, że nie obsługuje języka polskiego. Nie jest więc wiele wart w polskim biurze.



marek003 - 29 Lut 2008 11:55
Ale pakiet OO strasznie muli komputer w dodatku nie jest w pełni kompatybilny z dokumentami doc. Rozwala tabele, nagłówki przypisy itp.
A co do arkusza kalkulacyjnego to ... Owszem proste rzeczy da sie policzyć i w OO ale te poważniejsze funkcje nie mają swego odpowiednika nie mówiąc o kompatybilności z plikami xls.

Co do ORC ze skanerami to z reguły sa to programy w stylu "express" (z ograniczonymi funkcjami) a nie "prof" z tym że też działają. Mam ze skanerem program Finereader sprint działa nieźle ale brakuje parę opcji (rozszerzeń ustawień skanowania, analizy i czytania) przy specyficznych rzeczach.





forsoft - 29 Lut 2008 12:46
Nie ulega wątpliwości, że MO jest szybszy i posiada pewne specyficzne funkcje niedostępne w OO. Jednak żaden z moich klientów nie używa tych zaawansowanych dodatków. W 99% wykorzystywane są tylko podstawowe funkcje. Profesjonalista obrabiający teksty tub tworzący skomplikowane arkusze może wykorzystać "drogie" funkcje MO. Jednak 99% pracowników biurowych używa "maszyny do pisania" i "liczydeł". W tych zastosowaniach OO jest równie efektywny jak MO.

W większej skali, należy dążyć do unifikacji oprogramowania działającego na wielu stanowiskach, tak aby przenoszenie dokumentów było możliwie proste. Wyposażenie całej firmy w MO jest po prostu bardzo drogie. Tak więc to OO powinien być wykorzystany jako podstawa i poziom odniesienia do innych rozwiązań.

Zgodność OO z dokumentami zapisanymi w MO jest dość dobra, jeżeli nie użyto w nich skomplikowanych "drogich" i w 99% nie używanych mechanizmów. Format ODF pochodzący z OO 2 jest standardem ISO oraz oficjalnym formatem urzędowym w naszym kraju. Tak więc formaty DOC i XLS choć bardzo popularne to zaczynają być przestarzałe.

OCR to stosunkowo rzadko używana funkcja. W zasadzie powinno wystarczyć jedno stanowisko, aby zaspokoić potrzeby większości firm w tym względzie. Na dobrą sprawę, to konwersja PDF do edytowalnego formatu tekstowego wydaje się być bardziej pożądana niż OCR z użyciem skanera.



marek003 - 29 Lut 2008 22:12
Ja z kolei spotkałem się bardziej ze "standardem" rtf, pdf, doc, xls.
Na internecie wszystkie wnioski pisma i wzory są z reguły w tych formatach. Korespondencja z bankami również.
Z jednej strony MO jest "drogie" ale dla biura wystarczy wersja worda z excelem (ok 750zł) poza tym wrzucasz to w koszty.

Poza tym (2 lata temu było o tym głośniej ale nie interesowałem się jakim prawnym postanowieniem to sie skończyło) firma prowadząca działalność gospodarczą nie powinna używać nic za darmo. Jeżeli używa czegoś za darmo powinna do kosztów doliczyć wartość podobnej rzeczy (pełniącej podobne funkcje) którą można zakupić na rynku. (Nie wiem czy jasno to opisałem).



jag61 - 29 Lut 2008 22:28
Panowie (-anie?) - wydaje mi się, że to dyskusja typu "o wyższości świąt...." - fakt jest tylko jeden - Polsak jako kraj (urzędy) nie jest gotowa do używania oprogramowania OpenSource... Daje się to zauważyć na każdym kroku ( u mnie w firmie też..-
... w programie Word, czcionka TimesNewRoman 12, odstęp 1,5 ... - cytat z okólnika ) - dlatego, jak napisał marek -
Ja z kolei spotkałem się bardziej ze "standardem" rtf, pdf, doc, xls. .
Ale mam nadzieję, że jeszcze trochę i to się zmieni ( używam i MsO i OO - kiedyś WordPerfect i TAG ).



forsoft - 29 Lut 2008 23:39

Ja z kolei spotkałem się bardziej ze "standardem" rtf, pdf, doc, xls.
Na internecie wszystkie wnioski pisma i wzory są z reguły w tych formatach. Korespondencja z bankami również.
Z jednej strony MO jest "drogie" ale dla biura wystarczy wersja worda z excelem (ok 750zł) poza tym wrzucasz to w koszty.

Poza tym (2 lata temu było o tym głośniej ale nie interesowałem się jakim prawnym postanowieniem to sie skończyło) firma prowadząca działalność gospodarczą nie powinna używać nic za darmo. Jeżeli używa czegoś za darmo powinna do kosztów doliczyć wartość podobnej rzeczy (pełniącej podobne funkcje) którą można zakupić na rynku. (Nie wiem czy jasno to opisałem).


Przy 10 stanowiskach z 750 złotych robi się 7500. Aby taką kwotę puścić w koszty, najpierw trzeba by te pieniądze zarobić.

Ta słynna sprawa z określeniem wartości OO na podstawie pakietu MO zaczęła się od bardzo trywialnego błędu. Środek trwały nie może nie posiadać wartości. Ewidencja środków trwałych jest przeznaczona do gromadzenia informacji o środkach o sporej wartości i dużej trwałości. Wpisanie w ewidencję OO było więc bezpodstawne. Tak więc można użytkować darmowy OO w firmie, ale nie należy wpisywać tego w ewidencję.

Urzędnicy zawsze byli żródłem dowcipnych sytuacji. W sądzie w Giżycku zarządano od przedsiębiorcy ściągającego dług oryginału faktury. Tłumaczenie, że oryginał posiada jedynie kupujący, a u sprzedającego może pozostać jedynie kopia nie dawało rezultatu. Wiele zachodu kosztowało przekonanie urzędniczki w sądzie, że kopia faktury jest oryginałem dokumentu sprzedaży, pomimo, że pisze na nim kopia.



Platon - 29 Lut 2008 23:44
marek003 - po co powtarzac jakies stare historie i legendy miejskie?

jag61 - a ty juz w ogole pojechales. Program jest dobry, albo zly - nie ma zadnego znaczenia czy jest open source czy nie. Mylisz pojecie funkcjonlanosci gotowego softu z otwartym/zamknietym kodem. A ten opis jest dla komputerowych "lajkonikow" i oznacza format doc.

forsoft - nie da sie tego OOCR skompilowac?
Jak nie, to kup skaner z finereaderem jak najnowszym. (finereader sprint - zazwyczaj w pelnej wersji)



forsoft - 01 Mar 2008 00:17
Nie widzę potrzeby kompilacji kodu żródłowego. Można bezpiecznie założyć że projekt ten nie obsługuje języka polskiego, podobnie jak Simple OCR.

Zakup skanera z dołączonym oprogramowaniem wydaje się być najlogiczniejszym i najtańszym rozwiązaniem.

Mam jednak jeszcze jeden nietypowy pomysł. Firma dysponuje już urządzeniem wielofukcyjnym pełniącym funkcję drukarki i skanera sieciowego. Szczególnie interesującą funkcją jest możliwość skanowania dokumentów bezpośrednio do formatu PDF. Korzystając z konwertera formatu PDF będącego także w ofercie ABBY powinno dać się uzyskać zdatny do edycji dokument tekstowy. Co ciekawe, konwerter PDF jest znacznie tańszy od programu OCR tego samego producenta.



jag61 - 01 Mar 2008 00:36
Platon - fakt - ale oprogramowanie "robi" się "dobre" - (niestety) metodą prób, błędów, długiego czasu i używania.
A "mięsień" nieużywany zanika (lub się nie rozwija) - tak samo jak oprogramowanie....
P.s.
Zostałem "zmuszony" w pracy do odejścia od WordPerfecta ze względu na "niekompatybilność" z MsO (niestety) - choć wtedy był lepszy (moje zdanie) niż produkt Microsoftu....
Pozdrawiam wszystkich.
P.s. 2
Cytat z okólnika z pracy podałem ponieważ kiedyś przekazałem dokument w formacie właśnie .odf - i trzeba było go przerabiać na .doc - choć wiem, że mają też OO.