מאמר טכני

מאמר טכני: Build a PDF Intake Review Workbench in Delphi with PDFium בעברית

הגרסה המקומית הזו מתמקדת ב-Build a PDF Intake Review Workbench in Delphi with PDFium Component ומשתמשת במאמר האנגלי המעודכן כבסיס טכני לצוותי Delphi, PDF ותוכנות מסמכים

הדף הופך את מאמר הבסיס המעודכן לנקודות בדיקה מעשיות עבור תכנון, יישום ואימות

מה סונכרן מהמאמר האנגלי

מאמר הבסיס באנגלית הורחב בהקשר יישומי, החלטות טכניות ודוגמאות קונקרטיות, ולכן דף זה מיועד לשמש מדריך עבודה ולא תקציר קצר

חלקים חשובים במאמר הבסיס המעודכן:

  • השתמשו תחילה בקובצי קלט קטנים שניתן לשחזר
  • השאירו ללא שינוי שמות מוצרים, API, קבצים וערכי literal
  • שמרו את פלט ה-validator ואת פרטי הגרסאות יחד עם קובץ הדוגמה שנוצר

בחירות מעשיות ביישום

התחילו מסוג הקובץ, הפלט הרצוי ומצב השגיאה שהמשתמש צריך לראות. לאחר מכן קשרו כל קריאת API לתוצאה ניתנת לבדיקה, כדי שאימות, רישום ותמיכה יוכלו לשחזר את תרחיש הלקוח

  • השתמשו תחילה בקובצי קלט קטנים שניתן לשחזר
  • השאירו ללא שינוי שמות מוצרים, API, קבצים וערכי literal
  • שמרו את פלט ה-validator ואת פרטי הגרסאות יחד עם קובץ הדוגמה שנוצר

קוד ונקודות API

דוגמאות הקוד נשמרות ללא שינוי כדי שמפתחים יוכלו להשוות אותן ישירות לפרויקטי Delphi, C++Builder ו-Lazarus/FPC

procedure InspectIncoming(const IncomingPath: string; var Rec: TIntakeRecord);
var
  Pdf: TPdf;
begin
  Pdf := TPdf.Create(nil);
  try
    Pdf.FileName := IncomingPath;
    Pdf.FormFill := False;     // no form environment, no JavaScript init
    Pdf.Active := True;        // failure is silent: Active simply stays False

    if not Pdf.Active then
    begin
      Rec.OpenFailed := True;  // damaged file or user-password lock
      Exit;                    // the finally block still runs
    end;

    Rec.PageCount := Pdf.PageCount;
    CollectIdentity(Pdf, IncomingPath, Rec);
    CollectRiskSignals(Pdf, Rec);
  finally
    Pdf.Active := False;
    Pdf.Free;                  // never leak the instance on a malformed file
  end;
end;
procedure CollectIdentity(Pdf: TPdf; const FilePath: string;
  var Rec: TIntakeRecord);
begin
  Rec.Title := Pdf.Title;             // Info dictionary value
  Rec.Author := Pdf.Author;
  Rec.CreatedAt := Pdf.CreationDate;  // raw PDF date string ("D:2026...")

  // An empty Info title does not mean the document is untitled. The
  // component does not expose the XMP packet, so probe the raw file
  // bytes for the dc:title element before trusting the blank.
  if (Rec.Title = '') and FileContainsText(FilePath, 'dc:title') then
    Include(Rec.Flags, ifTitleInXmpOnly);
end;
procedure CollectRiskSignals(Pdf: TPdf; var Rec: TIntakeRecord);
var
  i, PageNo: Integer;
  Ext: string;
begin
  Rec.IsEncrypted := Assigned(FPDF_GetSecurityHandlerRevision) and
    (FPDF_GetSecurityHandlerRevision(Pdf.Document) <> -1);
  Rec.HasForms := Pdf.FormType <> ftNone;
  Rec.IsXfa := Pdf.FormType = ftXfaFull;
  Rec.HasJavaScript := Pdf.JavaScriptActionCount > 0;

  // AnnotationCount is a per-page property; walk the pages to total
  // it. Loading a page object renders nothing, so this stays cheap.
  Rec.Annotations := 0;
  for PageNo := 1 to Pdf.PageCount do
  begin
    Pdf.PageNumber := PageNo;
    Inc(Rec.Annotations, Pdf.AnnotationCount);
  end;

  Rec.Attachments := Pdf.AttachmentCount;

  for i := 0 to Rec.Attachments - 1 do
  begin
    Ext := LowerCase(ExtractFileExt(string(Pdf.AttachmentName[i])));
    if (Ext = '.exe') or (Ext = '.js') or (Ext = '.vbs') or (Ext = '.dll') then
      Include(Rec.Flags, ifDangerousAttachment);
  end;
end;

בדיקה לפני פרסום

בדקו את קובץ הפלט באותם כלים שבהם ישתמש הלקוח או הארכיון. תעדו גרסת רכיב, נתוני בדיקה, גרסת validator ותוצאה נצפית כדי לעקוב במדויק אחר רגרסיה עתידית

הרחבה מעשית

במאמר הזה על עיבוד PDF ב-Delphi, הצפנה, חתימות, תצוגה, פריסה ואימות המטרה אינה רק לתאר מה הרכיב או הזרימה עושים, אלא להראות איך קוראים אותם בתוך עבודה אמיתית: מה בודקים תחילה, איזה מצב כשל צריך להישאר גלוי, ואיך מחברים את הקריאות כך שאפשר יהיה להריץ את אותו מסלול שוב מחר בלי לנחש מה השתנה

כשעובדים עם עיבוד PDF ב-Delphi, הצפנה, חתימות, תצוגה, פריסה ואימות, כדאי להתחיל מקלט קטן ושחזורי, להגדיר תוצאה צפויה אחת ברורה, ורק אחר כך לעבור לזרימה המלאה שבה גודל, תוכן, הרשאות או מבנה פנימי הופכים את הבדיקה לרגישה יותר. כך כל שינוי קטן נשאר ניתן להסבר ולא נעלם בתוך קובץ גדול או דוגמה חצי־מוכנה

  • בדקו קלט קטן ושחזורי לפני מעבר לקבצי ייצור
  • תעדו גרסאות רכיב, מנוע וכלי אימות יחד עם התוצאה
  • חזרו על אותו מסלול קריאה כדי לוודא שאין סטייה