qtablog

A QTA blogoldala

2016. december 13. - A költségvetés-alapadatbázisok felépítésének tapasztalatai

2016. december 13. 14:56
2016. december 13. - A költségvetés-alapadatbázisok felépítésének tapasztalatai

Bejegyzésem a CAP projekt keretében gyűjtött magyar költségvetések és zárszámadások (1868-2015) forrásdokumentumainak beszerzésére tér ki. Cél egy olyan alapadatbázis létrehozása, mely segítséget nyújthat az ország pénzügyi helyzetét érintő kutatások számára. Rövid elemzésem két szempont alapján vizsgálja a témát: 1. a források felkutatása és letöltése 2. a lementett fájlok feltöltése a CAP szerverére és hivatkozásuk a projekt online felületére.

A feladat megkezdése előtt érdemes átgondolni, hogy milyen ütemben és szempontok szerint végeznénk a kutatást. Munkánk átláthatóságát egy előzetesen létrehozott excel tábla segítheti, mely nem csak számunkra, de a későbbiek során más kutatóknak is hasznos információkkal szolgálhat az összegyűjtött dokumentumokról. A táblázatba érdemes olyan adatokat felvezetni, mint az adott költségvetési év évszáma, a forgalomban lévő pénznem, illetve az eredeti tárhelyek linkje. Fontos, hogy ez utóbbit abban az esetben se mulasszuk el megjelölni, ha később pdf vagy word formátumban menjtük a forrásokat, hogy szükség esetén a fájlok bármikor visszakereshetőek legyenek.

                        Excel alapadatbázis: Költségvetés forrásai (1991-2013) (Forrás: http://cap.tk.mta.hu/koltsegvetes1991-2013)

 

A magyar költségvetések és zárszámadások jelentős része online viszonylag könnyen elérhető: a 19. század végét, valamint a 20. század első éveit lefedő dokumentumok több elektronikus könyvtár archivumában, míg a későbbi időszakot érintő szövegek különböző online jogtárakban lelhetők fel. Akadnak azonban kivételek: bizonyos évekről az interneten semmilyen adatot nem találunk, mely esetben az Országos Levéltár nyújthat segítséget számunkra. További problémát jelenthet, hogy az egyes évekről eltérő részletességű – vagy hiányos – költségvetések és zárszámadások maradtak ránk, így például az 1953. évi néhány mondatból álló (valamint az 1954-es költségvetéssel is összevont) zárszámadás a korábbi évek akár több száz oldalas terjedelmű és rendkívül részletes dokumentumaihoz képest kevesebb információval szolgál az adott év pénzügyi helyzetéről. Megjegyezendő azonban, hogy mielőtt feltöltenénk a CAP szerverére a forrásokat, meg kell győződnünk arról, hogy kellően körültekintően végeztük-e keresésünket és egy másik tárhelyen nem-e található egy részletesebb verzió az általunk hiányosnak vagy rövidnek vélt változatról.  Ezen felül, ahogyan haladunk visszafelé az időben, számos költségvetés és zárszámadás egyéb pénzügyi jelentéssel vagy kézirattal együtt lett felöltve, így fokozottan figyelni kell a szükséges oldalak kiszűrésére, valamint hiánytalan letöltésére is.

 

                       Htm kiterjesztés: 1877. évi költségvetés (Forrás: http://cap.tk.mta.hu/koltsegvetesek-forrasai-1950-1990)

 

A fájlok kiterjesztését tekintve az 1949-es év jelent fordulópontot. Míg az 1868-1949 közötti időszak forrásai főként pdf-ként érhetők el, addig az 1950-es évektől napjainkig htm formátumban érdemes gyűjteni a fájlokat. A két kiterjesztés közötti különbség a lementés szempontjából érdekes – a pdf dokumentumokat ugyanis nehezebb (és időigényesebb) menteni, hiszen általában több részletben érhetőek el. Így amellett, hogy a folyamat hosszadalmassá válik, külön programot is telepíteni kell ahhoz, hogy a keresett szöveget egy fájlként lehessen kezelni.

A forrásokat a munkafolyamat második részében a CAP szerverére töltsük fel, hogy a projekt honlapjának felületére felmásolt linkek minden esetben ide mutassanak vissza. Ennek elmulasztása esetén: 1. a külső tárhely esetleges megszűnésével a fájlok is eltűnhetnek 2. a mi számítógépünkkel is bármi történténhet, amely szintén a források elvesztését okozhatja. A szerver egy könnyen telepíthető Ftp program segítségével bármikor, egyszerre több felhasználó számára is elérhető, így a kutatók akár párhuzamosan is dolgozhatnak különböző feladatokon.

Utolsó lépésként a projekt honlapjának vonatkozó aloldalain hozzunk létre egy-egy éves bontású táblázatot, hogy a hivatkozott (CAP szerverre mutató) fájlok egy kattintás után elérhetőek legyenek. A táblázat mellé a munkafolyamat elején létrehozott excel táblát is érdemes csatolni, mely hasznos információkkal szolgálhat a forrásokat felhasználó további elemzések számára.