Freitag, 29. Mai 2015

Die dpi-Werte von PDF- und Bilddateien

Gerade erhielt ich die Mailanfrage eines Kunden wie man sicher die dpi-Werte von PDF- und Bilddateien ermitteln kann...

Den dpi-Wert kann man relativ leicht ausrechnen.
1 dpi entspricht 1 Pixel pro Zoll und 1 Zoll sind 2,54 cm.
Eine Bilddatei mit einer Breite von 1024 Pixel und 10 cm Breite hat einen dpi-Wert von ( 1024 x 2,54 ) / 10 ... also in diesem Fall 260 dpi.

Ein DIN A4 PDF hat die Standardabmessungen von 595 x 842 Pixeln.
Mit 21 cm Breite und einer Pixelbreite von 595 sind das:
( 595 x 2,54 ) / 21 ... also die berühmten 72 dpi.

Wenn z.B. eine DIN A4-PDF-Seite direkt zur Bilddatei gerendert wird, ist die Qualität deswegen nie so besonders toll, weil immer nur die 72 dpi dabei herauskommen können.

Dienstag, 23. Dezember 2014

Foxit versus Adobe ... oder auch "David gegen Goliath"

Adobe hat als treibende Kraft das von ihnen publizierte PDF-Format als einen "Quasi-Standard" besonders auch für Online-Dokumente etabliert. Ein Dokumenten-Standard sollte auch für alle Anwender nutzbar (lesbar) sein und so gab es von Adobe den kostenlosen Adobe Reader für PDF-Dokumente.

PDF-Dokumente müssen natürlich auch irgendwann mal erstellt worden sein. Einmal die normalen Dokumente aber gerade auch für Formulare ist das PDF-Format gut geeignet. Durch Einbettung von z.B. JavaScript-Aktionen und Schaltflächen kann den Formularen viel Eigenleben eingehaucht werden. Für alle diese Dinge gibt es eine ganze Reihe von Adobe Produkten - kostenpflichtige Produkte, die im hohen drei- ... meistens vierstelligen Bereich liegen.

Seit Version 1.0 der PDF-Spezifikationen sind viele Jahre vergangen und mit jeder neuen Version des kostenlosen Adobe Readers wuchs dessen Installationsumfang um viele MBs. Dieser Umstand rief die Open Source Community auf den Plan. Auf Basis einer Open Source Bibliothek wie z.B. GhostScript wurden  alternative Möglichkeiten der kostenlosen PDF-Erstellung in Form von Druckertreibern (einbindbar in z.B. Office-Produkten) veröffentlicht. Beispiele hierfür sind z.B. der PDFCreator und FreePDF. Daneben gibt es inzwischen auch eine Reihe kostenloser PDF Reader, die teilweise nicht mal installiert werden müssen sondern - als portable Version - einfach auf die
Festplatte kopiert funktionsfähig sind.

Der - meines Wissens - bekannteste Vertreter der alternativen PDF Reader ist der Foxit Reader. Während z.B. eine Adobe Reader 10 Installation mit einem Umfang von 457 MB daherkommt, sind es beim Foxit Reader 5.4.2 schlanke 44 MB! ... Und wenig MBs bedeuten wenig PLatz auf  Festplatten und ein schnellerer Start der Anwendung! Als kleiner Tipp: Wer wirklich nur ein "PDF-Anzeige-Programm" benötigt, dem möchte ich "Sumatra PDF" (besonders auch in der portablen Version) ans Herz legen. Mehr braucht man oft nicht.

Was treibt ein großes Unternehmen wie Adobe dazu an, mit dem PDF-Format einen "quasi" Dokumentenstandard zu etablieren? ... Natürlich auch das - völlig legitime - Geldverdienen ;-) So gibt es inzwischen natürlich nicht nur den Adobe Reader sondern auch die hochpreisigen Produkte aus der Adobe Acrobat-Reihe, die alles rund um die Erstellung von PDF-Dokumenten ermöglichen.

Das so etwas - mit vergleichbarer Qualität - auch günstiger geht, beweist die Foxit Corporation - Hersteller des kostenlosen Foxit PDF Readers. Gestartet mit dem Reader, den es inzwischen neben Windows für so ziemlich jede technische Basis (auch iOS und Android) gibt, bietet das Unternehmen  eine ganze Reihe schlanker und kostengünstiger Produkte für die PDF-Entwicklung und -Bearbeitung an. Das reicht von Anwendungen zur PDF-Bearbeitung und -Erstellung bis hin zu kompletten Entwickler-SDKs. Das alles mit einem "preislich sehr zurückhaltenden" Lizenzverfahren.

Als Entwickler im PDF-Umfeld habe ich natürlich mehrere Produkte und Versionen von PDF-Readern und auch verschiedene Adobe Reader Versionen installiert. Alleine schon, um sagen zu können "läuft auch auf Adobe...". In meinem alltäglichen Geschäft nutze ich allerdings
nur den Foxit Reader - Probieren Sie es aus ;-)

Donnerstag, 19. Dezember 2013

PrPages unterstützt jetzt auch "Grauwert-Toleranz"!

Mit der nun implementierten Unterstützung für "Grauwert-Toleranz" hat PrPages ein ausgereiftes Stadium erreicht. Was ist Sinn und Zweck dieses Wertes, den manche auch als "Grau-Schwellenwert" bezeichnen?

Manchmal ist es beim Betrachten von hellen bis sehr hellen Grauwerten ja tatsächlich so, dass man - je länger darauf geschaut wird - irgendwann gar nicht mehr weiß, ob es tatsächlich grau ist oder ob da nicht doch ein ganz leichtes Lila, Pink oder ganz helles Blau schimmert. Aufgrund dieses Umstandes arbeiten eine Reihe Druckertreiber optional mit der "Grauwert-Toleranz".

PrPages untersucht die RGB-Farbwerte jedes Pixels einer zu druckenden Seite. So hat man dann einen Wert für Rot, einen für Grün und einen für Blau. Die Werte reichen dabei jeweils von 0 bis 255. Bei echten Grauwerten sind diese drei Farbwerte absolut identisch. Da aber auch leichte Abweichungen durchaus noch als Grauwert interpretierbar sind, kann man eine Grauwert-Toleranz festlegen, bis zu deren Wert Dokumente noch mit echten Grauwerten ausgedruckt werden. So kann z.B. eine Grauwert-Toleranz von 10 dafür sorgen, dass auch Farbreihen wie R125 G121 B127 (mit einer Differenz von max. 6) noch als Grauwert ausgegeben werden.

Wenn für Sie identische Werte bei Druckausgabe und paralleler Verarbeitung wichtig sind, sollten Sie die neue Option "Grauwert-Toleranz" bei PrPages nutzen.

Montag, 3. Dezember 2012

Ermitteln farbiger Seiten in PDF-Dokumenten

In den Servicebereichen ist die Berechnung der Druckkosten 
bei PDF-Dokumenten immer ein beliebtes Thema. Braucht der
Drucker nur den günstigen schwarzen oder auch farbigen Toner?
Wieviele farbige und wieviele schwarz-weiße Seiten druckt
welcher Unternehmensbereich und mit welcher Papiergröße?

Intern in der Struktur eines PDF-Dokuments gibt es die
Device-Flags wie z.B. DeviceRGB, DeviceGray oder DeviceCMYK.
Diese weisen zwar auf farbigen Inhalt hin - zwingend ist das
aber nicht. Es kann durchaus sein, dass kein Device vorhanden
ist - es trotzdem aber auch farbigen Inhalt im PDF-Dokument
gibt. Genauso können beim DeviceGray trotzdem farbige Seiten
im Dokument auftauchen und - anders herum - könnte ein Dokument
mit DeviceRGB auch ohne farbigen Inhalt daherkommen.

Ein großes Problem in den Servicebereichen, für das es auch
Lösungen gibt - sehr teuere Lösungen.

Ich biete in meiner Produktpalette die Lösung "PrPages" an.
Es handelt sich dabei um eine sogenannte Commandline-Exe,
die somit problemlos in Workflows und allen Anwendungen (in
32- und 64-Bit-Windows-Umgebungen) einfachst einbindbar ist.

Das Modul verfolgt den Ansatz, dass sich die tatsächlichen
Farbinformationen in jedem einzelnen Bildpixel befinden
und nur hierüber die Bestimmung wirklich sicher möglich ist.
Beim Grafiktyp Bitmap enthält deswegen jedes Pixel drei Werte
zur Farbsetzung auf Pixelebene. "PrPages" rendert die PDF-
Seiten temporär im Hauptspeicher in's Bitmap-Format und prüft
die Pixelwerte bzgl. der Farbinformationen auf schwarz-weiß
und farbig. Im Ergebnis wird eine CSV-Datei erzeugt, die je 
nach optionaler Einstellung einen Eintrag pro Dokumentseite mit
mit dem Dateinamen, der Seitennummer, Seitengröße und dem 
Hinweis auf b/w oder farbig enthält oder (übersichtlicher) einen
Eintrag pro Datei mit den Angaben Dateiname, Gesamtseitenanzahl,
Seitengröße der ersten Seite, Anzahl farbigen und Anzahl der
b/w-Seiten.

Es ist gelungen diese sichere Technik sehr performant auf-
zubereiten. Auf meiner Produktseite unter www.pdf-analyzer.com
finden Sie die "PrPages" als Testversion, um sich von der schnellen
und zuverlässigen Arbeitsweise - vor dem Kauf - selbst zu überzeugen.

Montag, 9. April 2012

PDF, JavaScript und ungewollter Code

Hallo meine lieben Leser!

Im Zuge der Trojaner- und Virenangriffe tauchen immer mal wieder PDF-Dateien als Emailanhang auf, die beim Öffnen u.U. (je nach den Sicherheitseinstellungen auf dem lokalen Rechner) Schadsoftware installieren oder Systemeinstellungen ändern.

Dieses funktioniert i.d.R. über die Interpretersprache JavaScript. Mittels eingebettetem JavaScript-Code kann die Funktionalität einer PDF-Datei stark erweitert werden. Der enthaltene Code wird mit bestimmten Systemereignissen wie z.B. OnLoad (also beim Öffnen einer PDF-Datei) gekoppelt und dann ausgeführt. Natürlich kann so etwas positiv als auch negativ (zu Ihrem Schaden) genutzt werden. PDF-Reader von Adobe und Foxit sind in der Lage Javascriptcode aus/in PDF-Dateien zu lesen und auszuführen.

Standardmäßig wird die Verwendung von JavaScript bei Installation Ihres Adobe- oder Foxit-PDF-Readers mit aktiviert. Genauso haben Sie aber die Möglichkeit diese - oft nicht benötigte - Funktionalität wieder dauerhaft zu deaktivieren.

Beim Adobe Reader 9 oder z.B. 10 verwenden Sie hierfür den Menüweg:

...Bearbeiten -> Voreinstellungen -> JavaScript...

Im rechten Fensterbereich können Sie dann die Haken aus den Checkboxen bei
"Java Script / Acrobat JavaScript aktivieren" und
"Java Script Sicherheit / Menübefehlen Berechtigung zur Ausführung von JavaScript erteilen"
entfernen.

Beim Foxit-Reader 5 verwenden Sie hierfür den Menüweg:

...Werkzeuge -> Einstellungen -> JavaScript...

Entfernen Sie den Haken in der Checkbox bei
"Java Script aktivieren".

Wollen Sie sich mit solchen Dingen gar nicht beschäftigen und genügt Ihnen i.d.R. die einfache Anzeige einer PDF-Datei können Sie es mal mit dem kleinen, einfachen Sumatra PDF Reader probieren.

Viele Grüße,
Ingo Schmökel

Mittwoch, 2. März 2011

PDFs aus Ihrer Anwendung drucken

Meine lieben LeserInnen!

Ich hatte eine Kundenanfrage bezügl. des Druckens aus eigenen Anwendungen heraus unter Zuhilfenahme eines installierten PDF-Readers (versuchen Sie Foxit... für mich der beste!).
Ich habe ein wenig mit der Keybd_Event-Syntax von Delphi/Pascal zum virtuellen Auslösen der Tastatur "herumprobiert"...
Wenn Sie Delphi oder Free Pascal verwenden, können Sie den u.a. Code direkt hinter ein OnClick-Ereignis einer Schaltfläche in Ihrer Anwendung kopieren. In anderen Programmiersprachen werden Sie eine sehr ähnliche Syntax für diesen Zweck finden (oder fragen Sie Dr.Google).
Mit der Zeitangabe bei der sleep-Syntax können Sie noch etwas herumprobieren...

procedure TForm1.Button3Click(Sender: TObject);
begin
// At the uses-part don't forget the ShellAPI ;-)

// Show/open the pdf-document ...
ShellExecute(hinstance,'open',PChar('c:\temp\test.pdf'),nil,nil,SW_NORMAL);

sleep(2000); // sleep/wait for 2 seconds

// Virtual Keys [Strg] + [P] to open the print dialog ...
Keybd_Event(VK_CONTROL,0,0,0);
Keybd_Event(Ord('P'),MapVirtualKey(Ord('P'), 0),0,0);
Keybd_Event(Ord('P'),MapVirtualKey(Ord('P'), 0),KEYEVENTF_KEYUP,0);
Keybd_Event(VK_CONTROL,0,KEYEVENTF_KEYUP,0);

// Virtual key [ENTER] to start printout ...
Keybd_Event(VK_RETURN,1,0,0);
Keybd_Event(VK_RETURN, 1, KEYEVENTF_KEYUP, 0);

sleep(2000); // sleep/wait for 2 seconds

// Virtual keys [Alt] + [F4] to close the active reader-window ...
Keybd_Event(VK_MENU,0,0,0);
Keybd_Event(VK_F4,0,0,0);
Keybd_Event(VK_F4,0,KEYEVENTF_KEYUP,0);
Keybd_Event(VK_MENU,0,KEYEVENTF_KEYUP,0);

end;

Montag, 29. März 2010

From PDF to SAP SmartForms ... Automatically

My dear readers!

The reason in short ...
We had planned a banking product for several eligible customers based on an extensive form management in SAP Smartforms. We were facing problems like "only pdf-forms available" or "old pdf-forms should be completely redesigned". For a bank this can mean that hundreds of forms have to be converted... and the time is always short ;-)

Starting this project we knew that the needed new form creation in SAP Smartforms and the insertion of the recent pdf-forms into SAP would be the biggest time-package – not easy to be calculated. We discussed the idea to create a converter to manage at least the simple tasks of converting in an automatic way.

We had to regard two starting positions:
There were pdf-forms which should be transfered to SAP.
There were pdf-forms which should be completely redesigned before transfering to SAP.





Our basically idea was to extract the pdf-formfield data and properties, insert the data into an xml-structure and using the xml-uploadfunction in Smartforms as the final step. There were forms with less data and a clear structure but also very detailed and overcrowded structures. So we kept in mind that sometimes it would be probably necessary to turn a few screws directly in the converter source. The second part of the work should be the new designed forms. Here we started directly from scratch, creating doc-prototypes with associated technical files containing the formfield-properties. So no existing pdf-form for us. We decided to manage this problem with a different version of the converter. Both converter versions should be developed as a .NET-application. We used C# as ide.





Behind the converter-gui there are batch-modules (developed with Delphi as commandline-tools) doing three jobs for us:
• Extracting the main form-properties like used fonts, the form dimensions, date and time of creation, and so on.
• Extracting all form-fields with name, position values and field-lengths.
• Converting the displayed form content into a tiff-file, regarding the SAP tiff-specifications and the needed dpi-value as a backgoundimage for Smartforms.






The next point was a valid xml-structure to have a look inside. We got it doing a local xml-download of an existing form from Smartforms. We analyzed it, determined the parts which would be always the same and the parts which would be changed programmatically with variable values. We splitted the xml-structure into constant and variable templates. In the templates we signed the significant positions with unique placeholders. Our converter should transform all these things like form properties, field data, reference to the backgroundimage, constant and modified templates as the final step into one new xml-file for the Smartforms-upload.

To prepare Smartforms for the xml-upload first we have to create one single time a formstyle with all possible fontstyles used in the uploaded forms. Another point are the backgroundimages. They are created automatically while generating the upload-xml-structure but the local tiff-files still need to be transported into the SAP Form Graphics Administration (transaction SE78). At this time the referenced link is already in the xml-structure.

So the steps for existing pdf-forms are:
• Starting the converter.
• Selecting a pdf-form and moving through the converter-steps.
• Uploading the new tiff-file via transaction SE78 into SAP.
• Uploading the new xml-file into SAP Smartforms.
• Activating the new form in Smartforms. …That’s it!

At least the converter version for the non-existing forms… In this case the workflow is a bit different. The form properties are already extracted `cause we have the ascii-files with all form- and formfield-properties and bmp- or doc-prototypes.






First step is to convert the bmp- or doc-file into the tiff-format according to the SAP specifications. We’re using for this job the free graphic application „Gimp“. Although „Irfan View“ would be a good candidate for this job we should keep in mind that this application is only free for personal use. Then these tiff-files will be transfered into the SAP Form Graphics Administration (transaction SE78), too. Instead of grabbing the form- and field- properties from the pdf-form via commandline-tools the second version of the converter can read the needed data out of these technical ascii-files which come along with the bmp-prototype. At this stage the flow is the same. The xml-file will be created … uploaded …

So the steps for completely new forms are:
• Converting the bmp-file into tiff-format
• Uploading the new tiff-file via transaction SE78 into SAP.
• Selecting the technical form-data-file moving through the converter-steps.
• Uploading the new xml-file into SAP Smartforms.
• Activating the new form in Smartforms. …That’s it!

There’s one restriction: The described procedures concentrates themselves on the main task – creating single-page-forms. Sure it’s possible to enhance the converters for multi-page-forms but in our special case the cost-benefit ratio wouldn’t have a good relationship.

All together we had to convert approximately 300 forms. Normally this work would have lasted 100 days. With our converters we could do this job in less than 10 days!