Python zum Laufen bringen | Komentor

Als ich anfing, Programmieren zu lernen, arbeitete ich als Leasing-Operator oder „Pumper“ für ein Öl- und Gasunternehmen. Mein Job bestand darin, mitten ins Nirgendwo zu fahren und Pumpeinheiten sowie Öl- und Gasbatterien zu überprüfen. Ich war im Grunde ein menschlicher Computer, der die Produktion von Öl, Gas und produziertem Wasser maß.

Während ich die Unabhängigkeit des Jobs und das Arbeiten im Freien genoss, wurde es bald sehr eintönig, insbesondere die Menge der sich wiederholenden Dateneingaben, die erforderlich waren. Zur gleichen Zeit, als ich an der Universität Vollzeit Informatik studierte, beschloss ich, ein Programm zu schreiben, das die langweiligen Teile der Arbeit automatisieren würde.

An diesem Punkt meiner Reise hatte ich jedoch einfach nicht genug gelernt, um die Arbeit zu erledigen, aber es führte mich dazu, das Programmieren in Python zu entdecken, und hier wurde die Reise interessant.

python.png

Ich weiß, dass dieser Cartoon ein bisschen alt ist, aber genau so habe ich mich gefühlt. Plötzlich war ich kurz davor, Dinge mit meinem Computer zu tun, die ihn tatsächlich zu einem Werkzeug machten! Ich benutzte nicht mehr die Produktivitätssoftware eines anderen, sondern lernte, wie ich Dinge selbst erledigen kann.

Ich entdeckte auch das reiche Ökosystem von Online-Tutorials, Videos und Inhalten, die von so vielen Menschen vor mir erstellt wurden, und ich würde es versäumen, sie nicht zu nennen Al Schweigert, Michael Kennedy, Harrison Kinsley für ihre herausragenden Beiträge zu meinen frühen Schritten in Python.

Wenn Sie kein ganz besonderer Typ von Person sind, mögen Sie keine Dateneingabeaufgaben. Eine der ersten großen Aufgaben, die ich mit Python automatisieren konnte und mit der ich Einnahmen erzielen konnte, ist die Automatisierung von Excel-Tabellen.

Es fiel mir ziemlich leicht, früh Wege zu finden, damit zu spielen. Meine Frau, eine große Anzahl ihrer Freunde und natürlich Kollegen sind Petroleum Landmen, was im Grunde bedeutet, dass sie die enorme Menge an Papierkram erledigen, die Ölfirmen zum Bohren von Quellen benötigen.

Jedes Mal, wenn meine Frau sich mit einem ihrer Freunde/Kollegen traf, war es im Grunde ein ununterbrochenes Meckerfest darüber, wie schlecht ihre Systeme für den Umgang mit dem ganzen Papierkram waren und wie viel Zeit sie damit verschwendeten, Daten manuell von einer Tabelle auf eine andere zu übertragen .

Eins führte zum anderen und ich meldete mich freiwillig, um einer Freundin bei einer Dateneingabeaufgabe zu helfen, die sie mitnahm zwei Wochen manuell abzuschließen, die Übertragung eines riesigen PDF-Dokuments in eine mehrseitige Excel-Tabelle.


Hier haben wir es mit einem Beispiel mit 1671 Seiten zu tun, aber regelmäßig sind es mehr als 2000 Seiten

Ich weiß, dass ich bis zu diesem Punkt ein Loblied auf Python gesungen habe, aber bei meiner Suche nach einer Möglichkeit, die großen Datenmengen von der PDF-Datei nach Excel zu verschieben, fand ich ein sehr hilfreiches Tool, Tabula.

Tabula ist grundsätzlich in der Lage, alle Tabellendaten oder ähnlich formatierte Daten in einem PDF zu erfassen und in eine CSV-Datei zu übertragen. Nun, es ist nicht perfekt, es können Formatfehler auftreten, aber es ist immer noch eine sehr schnelle Möglichkeit, große Datenmengen aus einem PDF zu ziehen. Die Formatierung können Sie anschließend vornehmen. Um die gewünschten Daten zu erfassen, können Sie tabula die Bereiche automatisch auswählen lassen, die es für Tabellen hält, oder Sie können die gewünschten Bereiche manuell auswählen.


Mit Tabula können Sie einen Tabellenbereich auswählen und ihn auf einer oder allen Seiten des Dokuments verwenden

Die Möglichkeit, die Bereiche anzupassen, aus denen Sie Text abrufen möchten, erleichtert die Datenerfassung und ermöglicht die einfache Verwendung von Tabula für eine Vielzahl von Dokumenten. Es gibt zwar eine Reihe von Möglichkeiten, PDF-Daten mit Python wie pdfminer, PyPDF2 usw. abzurufen, aber ich fand die Verwendung von Tabula schneller und flexibler. Ich möchte noch einmal betonen, dass es bei der Verwendung von tabula eine Reihe von Formatierungsfehlern gab, aber diese zu beheben wurde später tatsächlich zu einem großartigen Lernwerkzeug.

Ich mache jetzt eine Pause, weil ich in einen lang ersehnten, hoffentlich wohlverdienten Urlaub fahre. Ich hoffe, dass ich die Zeit finde, während ich mich entspanne, um den nächsten Teil dieser Serie fertigzustellen, aber ich möchte ein paar Gedanken hinterlassen.

Als ich die Reise des Programmierenlernens begann, begann ich sie auf mehrteilige Weise. Ich begann damit, mir selbst etwas beizubringen, nahm an traditionellen CS-Kursen in der Schule teil und verschlang jedes Online-Tutorial, das ich finden konnte. Ich fand, dass die starke Betonung der Webentwicklung schwer zu überwinden war.

Alles, was ich ursprünglich wollte, war, mein Leben einfacher zu machen, indem ich einige Aufgaben automatisierte, und fast jede Ressource, die ich finden konnte, war der Webentwicklung gewidmet. Während es für jeden Softwareentwickler unglaublich wichtig ist, die Webentwicklung zu verstehen, denke ich, dass es eine große Anzahl von Programmierern abschreckt, weil es so komplex sein kann.

Ich denke, wenn mehr Programmierer anfangen könnten, so etwas wie die Aufgabe zu erledigen, über die ich jetzt schreibe, und sich dann den Weg in die Webentwicklungsaufgaben erleichtern könnten, könnten mehr dabei bleiben. Nur meine Meinung.


Wir sehen uns nach dem Urlaub.

Similar Posts

Leave a Reply

Your email address will not be published.