Importare dati da Pdf



  • Importare dati da Pdf
    di Andre (utente non iscritto) data: 14/05/2013 15:23:13

    Ciao a tutti!!!

    Avrei bisogno di importare dei dati da file pdf a Excel:
    In una cartella sono presenti tutti i file pdf da leggere salvati nel formato: Scheda_1 , Scheda_2, Scheda_3 ............

    Quello che vorrei fare è attivare una macro da Excel che mi legge iterativamente tutti i file pdf, li apre, e copia il contenuto su Excel dividendo opportunamente i dati per colonne. Ad es nel file pdf il titolo della scheda tecnica e la data sono presenti sulla stessa riga, la macro da realizzare dovrebbe importare su Excel i dati in due colonne distinte: Colonna titolo e colonna data.

    Per ogni file pdf vorrei avere una riga corrispondente nel file Excel con le varie suddivisioni in colonna.

    Avevo già fatto una cosa simile prendendo i dati da word e fissando i riferimenti delle stringhe da copiare con l'ausilio dei segnalibri, purtroppo non saprei proprio come fare per leggerli da file pdf.

    Grazie a tutti per un eventuale aiuto!!!

    Ciao ciao



  • di Vecchio Frac data: 14/05/2013 17:39:05

    Potresti passare per uno di quei siti che convertono, online e free, i file pdf (risultato non garantito però).
    Se sono schede tecniche perchè non chiedi al fornitore (o al produttore) direttamente i file nel formato da te desiderato?





  • di Andre (utente non iscritto) data: 14/05/2013 18:31:28

    Ciao, nn posso perchè il fornitore mi da solo il pdf, dai siti online nn lo vorrei fare perchè lo devo per tantissimi pdf (100 al giorno) quindi sarebbe troppo ripetitivo, per questo vorrei farlo con una macro che mi apre tutti i pdf e mi copia il contenuto in un file excel .. any idea?!?



  • di Vecchio Frac data: 14/05/2013 20:30:10

    Hai Adobe Acrobat 9?
    Spulciando Google ho trovato questo codice.
    Io non posso provarlo.
    Ma se funziona sei a posto.. dovrai solo implementare un ciclo che scandisce i file pdf e poi salva il file risultante,. lo chiude e si appresta a leggere il successivo pdf.
    Leggi le istruzioni commentate nel codice e good luck :)
     
    Sub ImportPDFFileData()
    'Author: Steve Lipsman
    'Purpose: Import PDF File Data Into Excel Worksheet
    'Other Requirement(s): 'Acrobat' Checked in VBA Tools-References
    'Reference Renames Itself 'Adobe Acrobat 9.0 Object Library' After Reference Is Saved
    
    'Declare Variable(s)
    Dim appAA As Acrobat.CAcroApp, docPDF As Acrobat.CAcroPDDoc
    Dim strFileName As String, intNOP As Integer, arrI As Variant
    Dim intC As Integer, intR As Integer, intBeg As Integer, intEnd As Integer
    
    'Initialize Variables
    Set appAA = CreateObject("AcroExch.App"): Set docPDF = CreateObject("AcroExch.PDDoc")
    
    'Set PDF FileName
    strFileName = "Your Full PDF File Pathname Here.pdf"
    
    'Read PDF File
    docPDF.Open (strFileName)
    
    'Extract Number of Pages From PDF File
    intNOP = docPDF.GetNumPages
    
    'Select First Data Cell
    Range("A1").Select
    
    'Open PDF File
    ActiveWorkbook.FollowHyperlink strFileName, , True
    
    'Loop Through All PDF File Pages
    For intC = 1 To intNOP
    'Go To Page Number
    SendKeys ("+^n" & intC & "{ENTER}")
    
    'Select All Data In The PDF File's Active Page
    SendKeys ("^a"), True
    
    'Right-Click Mouse
    SendKeys ("+{F10}"), True
    
    'Copy Data As Table
    SendKeys ("c"), True
    
    'Minimize Adobe Window
    SendKeys ("%n"), True
    
    'Paste Data In This Workbook's Worksheet
    ActiveSheet.Paste
    
    'Select Next Paste Cell
    Range("A" & Range("A1").SpecialCells(xlLastCell).Row + 2).Select
    
    'Maximize Adobe Window
    SendKeys ("%x")
    Next intC
    
    'Close Adobe File and Window
    SendKeys ("^w"), True
    
    'Empty Object Variables
    Set appAA = Nothing: Set docPDF = Nothing
    
    'Select First Cell
    Range("A1").Select
    End Sub






  • di Andre (utente non iscritto) data: 15/05/2013 09:18:59

    Ciao Vecchio Frac! grazie mille per il codice però ti vorrei chiedere alcune cose:

    1) Io ho istallato Adobe Reader XI va bene ugualmente?? perché ho visto che Adobe Acrobat è a pagamento.

    2) attivando il codice mi da questo problema: "Errore di run time 429" Il componente ActiveX non è in grado di creare l'oggetto.

    Da Strumenti --> Riferimenti ho attivato la spunta alla casella "Adobe Acrobat 10 Type library" perché è l'unica che ho, però è diversa da quella indicata nel codice che mi hai postato "Adobe Acrobat 9.0 Object Library"