Hollosi Information eXchange /HIX/
HIX GURU 7118
Copyright (C) HIX
2019-02-17
Új cikk beküldése (a cikk tartalma az író felelőssége)
Megrendelés Lemondás
1 re: re:PDF szerkeszto / konvertalo (mind)  110 sor     (cikkei)
2 re: re: PDF szerkeszto / konvertalo (mind)  67 sor     (cikkei)

+ - re: re:PDF szerkeszto / konvertalo (mind) VÁLASZ  Feladó: (cikkei)

Sziasztok!

Mindenkinek köszönöm a sok hozzászólást, sok érdekesség is említésre került,
jelentem, a célhoz közelebb kerültem, annál is inkább, mert tovább kutakodtam.

Erről majd később, most reflektálnék pár hozzászólásra:

>Csak példaképpen Linux alatt a pdfmod-ra ezt írja a telepít?:
>"PDF Mod is a simple application for modifying PDF documents
>You can reorder, rotate, and remove pages, export images from a document,
>*edit the title, subject, author, and keywords,* and combine documents
>via drag and drop."
No, ezt meg is fogom nézni, nem hagyom ki, előbb wines lehetőségekre
koncentráltam, mivel nem csak én vagyok érintett a témában.

>Szerintem a *pdftk* is tud ilyesmit, de nem nézetem meg.
Erre rákerestem, de csak jpdftweak -ra találtam, erről van szó?
Ez pont nem tudja amit kellene, szóval a címet, szerzőt, stb.-t nem lehet
vele módosítani.

>Én nem tudom, hogy a te dokumentumaid hogyan épülnek fel,
Én sem tudom, ezeket sok sok évvel ezelőtt kaptam valakitől,
a legrégebbiek '90 -es évek közepe -vége felé keletkezhettek.
Soha nem nyitottam meg az összeset, több mint 10e dokumentumról
van szó, nem mind PDF, van mindenféle, és azon belül is számos
megoldás. (Fejezetek külön, képek külön, egybe html, külön sok html
ami egy fog össze, meg satöbbi)

>Bármelyik is a helyzet, az egyetlen járható útnak az újra-OCR-ezést
>tartom, mert akár fontokból, akár képb?l van berakva a megjelenés,
>szite biztos, hogy csak az "sértetlen" tartalom, a karakterkódolás már
>a .pdf-ben el van barmolva, és ha vissza is állítható, szoftver legyen
>a talpán, amelyik megcsinálja. Inkább meg kéne nyitni és szövegréteg
>nélkül újra elmenteni, vagy valami pdf->pdf konverterrel ezt
>megcsinálni. Esetleg pdf->PostScript konverzióval, ami kihagyja a
>szöveget és csak a nyomtatni való megjelenést kódolja. Majd
>ezekb?l a fájlokból újrakonvertálni .pdf-fé új, modern OCR-rel.
>Szerintem azt akár az Online Converter is megteszi,
Ácsi, ha újra OCR-ezem, akkor már mi a rossebnek konvertáljam
PDF-be? A cél a mobilon történő olvasás, erre pedig egyelőre
a Html a legalkalmasabb (sajnos)

>de biztos vannak letölthet? konverterek.
Hogyne lennének, egy rakatot kipróbáltam, de azért írtam,
mert mások véleményére is kíváncsi voltam.

>Szerintem sehogy. Anno decibel a PDF-ekben nem volt olyan font,
>ami magyar ekezetes karaktert tudott volna, tehat kvazi nyomdaszatilag
>ossze lett rakva egy o betubol meg egy ekezetbol.
>Innentol kezdve OCR nelkul eselytelen vagy konvertalni.
Azt nem gondolom, hogy sok mindenki fel volt szerelkezve olyan
profi cuccokkal, mit ilyeneket tudtak, de lehet.
De, kösz, figyelembe fogom venni.

>Környezetem:
>MacBook 10.13.6 (OS X, BSD Unix alapú),
>Aquamacs 3.4 (leánynevén emacs)
>Reguláris kifejezés: véges automatával felismerhet? jelsorozat
Á, nem egységesek a jelsorozatok, ahogy láttam :(

>Az OS X teljesen Unicode, azaz tud ,,minden" ábécét
>(majdnem...), így ékezetes bet?ket is.
Valahol már minden az, azaz a mai Win-ek is, és akkor
sincs semmi, mert a szoftvernek kell tudnia, amit kell.

>Pár részleges tippel szolgálhatok csak - ráadásul mindezt
>unix-linux stb. alapon, de tudtommal mennek Windows alatt
>is, annak kezelését másra hagynám.

>1. PDF szerkesztés
>Pdf-et korábban Adobe Acrobat DC (?) szerkeszt?vel
>szerkesztettem, ez fizet?s (drága).
Tudom, én még anno a 8-at használtam.

>Nem emlékszem már, mennyire volt könny? vagy sem a
>helyettesítés,
A Win-es verzióban annyira mint mondjuk Word-ben.

>de nem hiszem, hogy fölvenné a versenyt az
>Emacs/Unix módszerrel.
OK, de Unix-ot, ezért nem fogok telepíteni. ;-)

>Ennek egy lehetséges eszköze a pdf-tools
>https://github.com/politza/pdf-tools
>ez Emacs alapú, Windows-ban és OS X-ben (meg persze
>Linux-ban) is megy. Ha ehhez hozzájutsz illetve
>elsajátítod, sokat tudó eszköz lesz a kezedben. Ezt csak
>képzelem, ugyanis nem próbáltam. Ez tud pdf-b?l sima
>szöveget gyártani, ás akkor már nyert ügyed van, Emacs-ban
>helyreteszed a hibás bet?ket és visszaalakítod PDF-fé.
>3. Szövegb?l ismét PDF - Emacs, org
Ha sikerül idáig eljutni, eszem ágába sincs újra PDF-et
csinálni! A PDF szerkesztés csak addig érdekes, amíg
nincs megoldás egyszerűbb formátumba konvertálásra...

>Próbáld meg az eredeti ékezetes szöveges fileokat (pl html) sima
>notepad-al megnyitni majd változtatás nélkül elmenteni saveas-al úgy
>hogy nem a alapértelme zett ANSI kódolás van kiválasztva hanem
>az UTF-8.. (Ha hozzáad még txt kiterjesztést azt töröld)
>Ezután a konvertálóprogik jól kezelik az ékezeteket remélhet?leg.
Azannya, erre nem is gondoltam, ki fogom próbálni... kösz, ez jó
ötlet lehet.

No, akkor megosztom a további tapasztalataimat röviden.
Először win, mert bizonyos okokból ezzel próbálkoztam,
Linuxon is meg fogom nézni a dolgokat, arról is írok majd.
Külön levélben küldöm, mert attól félek, kifutok a sorlimitből.

-- 
Török István ___
+ - re: re: PDF szerkeszto / konvertalo (mind) VÁLASZ  Feladó: (cikkei)

Még régebben volt hogy ilyesmivel próbálkoztam fakultatív
módon, akkor pöpec html-eket produkáltam, de már nem
emlékszem, mivel csináltam.
Kettő jelölt van: Some PDF to Htlm converer, és a Bulefox
Html converter. Az előbbi még fent van W7-es gépen,
de az nem regisztrált, és az ingyenes változat csak 5 oldalt
hajlandó konvertálni, később meg semennyit.
Amikkel régebb próbálkoztam, egyik sem volt 5 oldalnál
több. A Bluefox Html converter teljesen ingyenes, de
a legtöbb vírusírtó prüszköl tőle. Az Avast is folyton
elemzi, végül azt mondja OK, mehet, de egyébként lassú,
és miegymás, az is gyanús, hogy lehet feltölti a PDF-et
valahová. Na ez már nincs fent a gépen, emlékeim szerint
leszedte vagy a NOD, vagy a Malware bytes, amikor live
rendszerről ellenőriztem a gépet. Azóta nem telepítettem
újra, nem kellett. A Html-ek megvannak az akkori
tesztekből, azok tökéletesek.

Ám mostani kutakodásom alkalmával találtam egy
gyöngyszemet:
Infix PDF Editor. Ez fizetős progi, én egy arhív helyről
szedtem le, ott azt írták, hogy leállt a fejlesztése,
de ettől függetlenül lehet a honlapon regisztrálni,
és fizetni is. Az ára 8,99 EUR, azaz kb. 3000 Ft.
Ehhez képest tökéletesen jeleníti meg a kipróbált
PDF-eket, amit teljeskörűen tud szerkeszteni, egészen
elképesztő! Kicsi, könnyű, ügyes.
Tud exportálni Html-be, Epub-ba. A Html képeit képes
beágyazottam is menteni, az Epub-ot viszont nem eszi
meg mobilon a Presitigio readerja, de nem próbáltam ki
az összes lehetőséget. A Htrml majdnem tökéletes, de
a címben (Pl. ZABHEGYEZŐ) levő nagy Ő elé betesz egy
sortörést. Érdekes módon csak ide, a szövegben nincs
baj ezzel sehol. Sebaj, úgy is kell némi utómunka,
mert a PDF oldalszámozást valahogy ki kell venni
a html-ből, mert az úgyis másképp lesz tördelve
minden megjelenítőn.
Erre majd kitalálok valami makrót. Érdekes viszont,
ahogy a többi szerkesztő (Word, LibreOffice, WisWaying Html Editor)
kezelik ezeket a html-ket. Mindegyikben jól néz, ki, de amiket
elmentenek.... Mi a túrónak csinál a word pl. "elemei" alkönyvtárat,
amibe tesz egy 2 xml-t, meg egy thmx fájlt?
(csak szórakozok, nem Word-al fogok html-t szerkeszteni)

+egy érdekesség: Van nekem egy már nagyon régi,
ma is jól működő Canon Canoscan 4200F szkennerem.
Még tavaly mondta a párom, szkenneljek be valami
orvosi papírokat, de ne képekbe, hanem, valami több
oldalasba, hogy egybe legyen. Mondom PDF, vagy TIFF?
Jótól kérdeztem :-) rávágta, bánja is, hogy mi, legyen PDF.
Még soha nem szkenneltem PDF-be ezzel a szkennerel,
amióta meg van. Van neki egy Canoscan Toolbox nevű
kezelőprogramja, ami a szkenner kezelőgombjaival
kommunikál, akkor először használtam. Megnyomtam
a PDF gombot, és szépen beolvastam az oldalakat,
már akkor is láttam, hogy milyen jó minőségűek, a sok
irodai monstrumokkal készített beágyazott képes
PDF-efekhez képest, és még véletlenül sem ferde
egyik sem...
Most elő kellett venni ezeket a PDF-eket, és amikor
néztem, belekattintottam az egérrel, erre kijelölt
egy szót :-) Ööö, nézem, mivan? Hát egészen
elképedtem, ez OCR-te a szöveget, és úgy mentette
a PDF-et! Méghozzá hibátlanul, mindet automatikusan!
Hogy mik vannak!
-- 
Török István ___

AGYKONTROLL ALLAT AUTO AZSIA BUDAPEST CODER DOSZ FELVIDEK FILM FILOZOFIA FORUM GURU HANG HIPHOP HIRDETES HIRMONDO HIXDVD HUDOM HUNGARY JATEK KEP KONYHA KONYV KORNYESZ KUKKER KULTURA LINUX MAGELLAN MAHAL MOBIL MOKA MOZAIK NARANCS NARANCS1 NY NYELV OTTHON OTTHONKA PARA RANDI REJTVENY SCM SPORT SZABAD SZALON TANC TIPP TUDOMANY UK UTAZAS UTLEVEL VITA WEBMESTER WINDOWS