I documenti PDF spesso contengono immagini preziose: fotografie, diagrammi, grafici e illustrazioni. Estrazione immagini La demo mostra come estrarre tutte le immagini incorporate da un documento PDF utilizzando PDFium VCL, salvandole in formati ottimali in base alle loro caratteristiche.
Panoramica
Questa demo estrae le immagini incorporate (bitmap) dalle pagine PDF e le salva come file immagine separati. Include l'anteprima delle immagini, il rilevamento del formato e l'estrazione in batch con il monitoraggio dei progressi.
Caratteristiche Principali
- Estrai tutte le immagini – Estrai ogni immagine incorporata dal PDF.
- Selezione dell'intervallo di pagine – Estrai solo dalle pagine specifiche.
- Rilevamento automatico del formato. – Sceglie automaticamente tra JPEG, PNG o BMP in base alle caratteristiche dell'immagine.
- Anteprima immagine – Anteprima delle immagini estratte prima di salvarle.
- Informazioni dettagliate. – Visualizza dimensioni, formato e dimensione del file.
- Elaborazione batch. – Estrai più immagini con monitoraggio dei progressi.
Requisiti delle librerie DLL di PDFium
Prima di eseguire qualsiasi applicazione VCL di PDFium, assicurarsi che i file DLL di PDFium siano installati:
pdfium32.dll/pdfium64.dll– Versioni standard (~5-6 MB)pdfium32v8.dll/pdfium64v8.dll– Con il motore JavaScript V8 (~23-27 MB)
Installazione: Esegui PDFiumVCL\DLLs\CopyDlls.bat come amministratore per copiare automaticamente i file DLL nelle directory di sistema di Windows.
Estrazione di immagini di base.
Accedi alle immagini incorporate tramite. Bitmap e BitmapCount proprietà:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
procedure ExtractImagesSimple; var Pdf: TPdf; I, J: Integer; Bitmap: TBitmap; begin Pdf := TPdf.Create(nil); try Pdf.FileName := 'document.pdf'; Pdf.Active := True; // Loop through all pages for I := 1 to Pdf.PageCount do begin Pdf.PageNumber := I; // Loop through all images on this page for J := 0 to Pdf.BitmapCount - 1 do begin Bitmap := Pdf.Bitmap[J]; try // Save as BMP Bitmap.SaveToFile(Format('Page%d_Image%d.bmp', [I, J + 1])); finally Bitmap.Free; end; end; end; finally Pdf.Active := False; Pdf.Free; end; end; |
Estrazione completa con rilevamento del formato.
La demo implementa la selezione intelligente del formato:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 |
procedure TFormMain.ButtonExtractClick(Sender: TObject); var I, J, StartPage, EndPage: Integer; Bitmap: TBitmap; FullFileName, DetectedFormat, ImageExtension: string; ImageInfo: TImageInfo; begin FCancelled := False; FProcessedImages := 0; FTotalImages := 0; ClearExtractedImages; EnableControls(False); try Pdf.FileName := EditPdfFile.Text; Pdf.PageNumber := 0; Pdf.Active := True; ParsePageRange(EditPageRange.Text, StartPage, EndPage); if EndPage = -1 then EndPage := Pdf.PageCount; // Calculate total images for progress for I := StartPage to EndPage do begin Pdf.PageNumber := I; FTotalImages := FTotalImages + Pdf.BitmapCount; end; ProgressBar.Max := FTotalImages; // Extract images for I := StartPage to EndPage do begin if FCancelled then Break; Pdf.PageNumber := I; for J := 0 to Pdf.BitmapCount - 1 do begin if FCancelled then Break; Bitmap := Pdf.Bitmap[J]; if Assigned(Bitmap) then begin try // Detect optimal format DetectedFormat := DetectImageFormat(Bitmap); ImageExtension := GetExtensionForFormat(DetectedFormat); FullFileName := Format('%s\Page%d_Image%d%s', [FCurrentOutputDir, I, J + 1, ImageExtension]); SaveBitmapInOptimalFormat(Bitmap, FullFileName); // Store image info for preview ImageInfo.FileName := FullFileName; ImageInfo.PageNumber := I; ImageInfo.ImageIndex := J + 1; ImageInfo.Width := Bitmap.Width; ImageInfo.Height := Bitmap.Height; ImageInfo.Format := DetectedFormat; ImageInfo.Bitmap := TBitmap.Create; ImageInfo.Bitmap.Assign(Bitmap); AddImageInfo(ImageInfo); Inc(FProcessedImages); ProgressBar.Position := FProcessedImages; finally Bitmap.Free; end; end; end; end; UpdateImageList; finally Pdf.Active := False; EnableControls(True); end; end; |
Rilevamento intelligente del formato.
Scegli il formato ottimale in base alle caratteristiche dell'immagine:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
function TFormMain.DetectImageFormat(ABitmap: TBitmap): string; begin // Check if image has transparency (alpha channel) if ABitmap.PixelFormat = pf32bit then begin // PNG for transparency support Result := 'PNG'; end // Check if it's likely a photographic image else if (ABitmap.Width * ABitmap.Height > 100000) and (ABitmap.PixelFormat in [pf24bit, pf32bit]) then begin // Large, complex image - use JPEG for smaller file size Result := 'JPEG'; end else begin // Small or simple image - preserve quality with BMP Result := 'BMP'; end; end; function TFormMain.GetExtensionForFormat(const AFormat: string): string; begin case UpperCase(AFormat)[1] of 'J': Result := '.jpg'; 'P': Result := '.png'; 'B': Result := '.bmp'; else Result := '.bmp'; end; end; |
Salvataggio nel formato ottimale.
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
procedure TFormMain.SaveBitmapInOptimalFormat(ABitmap: TBitmap; const AFileName: string); var JpegImg: TJPEGImage; FileExt: string; begin FileExt := UpperCase(ExtractFileExt(AFileName)); if FileExt = '.JPG' then begin // Save as JPEG with good quality JpegImg := TJPEGImage.Create; try JpegImg.Assign(ABitmap); JpegImg.CompressionQuality := 85; // Good quality/size balance JpegImg.SaveToFile(AFileName); finally JpegImg.Free; end; end else if FileExt = '.PNG' then begin // PNG would require additional library // Fall back to BMP for compatibility ABitmap.SaveToFile(ChangeFileExt(AFileName, '.bmp')); end else begin // BMP - lossless quality ABitmap.SaveToFile(AFileName); end; end; |
Utilizzo di TPdfImage per i dati delle immagini non elaborati.
Per casi d'uso avanzati, accedere ai dati delle immagini non elaborati:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
procedure ProcessRawImageData; var Pdf: TPdf; I: Integer; PdfImage: TPdfImage; begin Pdf := TPdf.Create(nil); try Pdf.FileName := 'document.pdf'; Pdf.Active := True; Pdf.PageNumber := 1; for I := 0 to Pdf.ImageCount - 1 do begin PdfImage := Pdf.Image[I]; // Access raw image properties ShowMessage(Format('Image %d: %d x %d, %d bytes', [I, PdfImage.Width, PdfImage.Height, Length(PdfImage.Data)])); // PdfImage.Data contains raw pixel data end; finally Pdf.Active := False; Pdf.Free; end; end; |
Visualizzazione delle informazioni sull'immagine.
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
procedure TFormMain.UpdatePreview(Index: Integer); var Info: TImageInfo; begin if (Index >= 0) and (Index < Length(FExtractedImages)) then begin Info := FExtractedImages[Index]; // Update preview if Assigned(Info.Bitmap) then ImagePreview.Picture.Assign(Info.Bitmap); // Update info display MemoInfo.Lines.Clear; MemoInfo.Lines.Add('File: ' + ExtractFileName(Info.FileName)); MemoInfo.Lines.Add('Page: ' + IntToStr(Info.PageNumber)); MemoInfo.Lines.Add('Dimensions: ' + IntToStr(Info.Width) + ' x ' + IntToStr(Info.Height)); MemoInfo.Lines.Add('Format: ' + Info.Format); if Info.Size > 0 then MemoInfo.Lines.Add('Size: ' + FormatFloat('#,##0', Info.Size) + ' bytes'); end; end; |
Analisi dell'intervallo di pagine.
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
procedure TFormMain.ParsePageRange(const ARange: string; var AStartPage, AEndPage: Integer); var RangeStr: string; DashPos: Integer; begin RangeStr := Trim(ARange); AStartPage := 1; AEndPage := -1; // -1 means extract to end if (RangeStr = '') or (UpperCase(RangeStr) = 'ALL') then Exit; DashPos := Pos('-', RangeStr); if DashPos > 0 then begin // Range format: start-end AStartPage := StrToIntDef(Trim(Copy(RangeStr, 1, DashPos - 1)), 1); AEndPage := StrToIntDef(Trim(Copy(RangeStr, DashPos + 1, Length(RangeStr))), -1); end else begin // Single page AStartPage := StrToIntDef(RangeStr, 1); AEndPage := AStartPage; end; end; |
Apri la cartella delle immagini estratte.
|
1 2 3 4 5 6 7 |
procedure TFormMain.ButtonOpenFolderClick(Sender: TObject); begin if DirectoryExists(FCurrentOutputDir) then ShellExecute(Handle, 'open', PChar(FCurrentOutputDir), nil, nil, SW_SHOWNORMAL) else ShowMessage('Output directory does not exist.'); end; |
Casi d'uso.
- Estrazione di risorse digitali. – Estrai foto e grafica dai materiali di marketing.
- Conversione dei documenti. Prepara le immagini per il web o altri formati.
- Elaborazione degli archivi. Estrai le immagini dagli archivi di documenti scansionati.
- Analisi dei contenuti. Estrai le immagini per il machine learning o l'analisi.
Conclusione.
La demo "Extract Images" mostra quanto sia facile estrarre immagini incorporate da documenti PDF utilizzando PDFium VCL. Il componente gestisce l'analisi complessa dei PDF, mentre tu ti concentri su come utilizzare le immagini estratte nella tua applicazione.
Combinato con la rilevazione intelligente del formato, puoi creare strumenti professionali di estrazione di immagini che producono output ottimizzati per qualsiasi caso d'uso.
Esplora. Componente PDFium. Visita loslab.com e sblocca i contenuti nei tuoi documenti PDF.