🗞 Новият брой на Капитал е онлайн >>

Минало-to.com

Началото на дигитализирането на националния архив е повече от добра новина, но все още се случва с детски стъпки

Държавна агенция "Архиви" разполага с един-единствен многопрофилен скенер
Държавна агенция "Архиви" разполага с един-единствен многопрофилен скенер
Държавна агенция "Архиви" разполага с един-единствен многопрофилен скенер    ©  Надежда Чипева
Държавна агенция "Архиви" разполага с един-единствен многопрофилен скенер    ©  Надежда Чипева
Бюлетин: Вечерни новини Вечерни новини

Всяка делнична вечер получавате трите най-четени статии от деня, заедно с още три, препоръчани от редакторите на "Капитал"

"...Ние не го оповестяваме и не бива да го оповестяваме, но трябва не по-малко от 200 хиляди души да изселим." 6 юни 1989 г. Заседание на Политбюро на ЦК на БКП. Единственото място в комунистическа България, на което репресиите на режима се назовават с истинските им имена. И мястото, на което се коват фалшификациите на думите и действията. 

Няколко дни по-рано държавният глава Тодор Живков прави изявление по националните телевизия и радио по т.нар. изселнически въпрос. Практическото прогонване на стотици хиляди български турци от домовете им и от страната се маскира като "обновление на нашето общество", което следва да предизвика "патриотичен подем". В присъствието на само още няколко "другари" от Политбюро обаче Живков оголва циничната истина: Да се изселят. Но първо да приберат реколтата. 

Стенограмата от това заседание се е пазила в архива на БКП с гриф "секретно". А за този документ, както и за много други от този период никога не се е предполагало, че ще стигнат до очите и съзнанието на обикновените хора. От тази седмица обаче около 70 хиляди листа с решения и протоколи на Политбюро от 1944 до 1989 г. са достъпни онлайн за всеки, които проявява интерес, на сайта archives.bg/politburo. Те са част от проект на Държавна агенция "Архиви" (ДАА) за постепенната дигитализация на документите, иначе пазещи се в папки и кутии в хранилищата на институцията.

Минало несвършващо

"Има нещо символично в това, че една от най-затворените и непрозрачни институции беше първата, която благодарение на новите технологии и усилията на много архивисти, може да хвърли светлина върху миналото ни. Днес са нужни само няколко дни, за да стигнат заседанията на Министерския съвет до всички, докато за протоколите на Политбюро бяха нужни между 20 и 60 години. А те никога не са мислени да видят бял свят", подчертава председателят на ДАА доц. д-р Мартин Иванов.

В първите два дни след пускането на сайта с многозначителното заглавие "Архивите говорят" интересът беше толкова голям, че той блокира. Големият брой на уникалните посещения изненада и ръководството на "Архивите". Наложи се IT екипът на агенцията да го прехвърли на нов сървър. Медиите пък цяла седмица бълваха изровени от протоколите истории - от това колко е била заплатата на Тодор Живков, през това как е била определяна цената на чорапогащниците, до технологията на "възродителния процес".

Председателят на агенция "Архиви" твърди, че самият той не е очаквал подобно внимание от страна на публиката, въпреки че решението да се качат онлайн първо документите на Политбюро не е случайно. "Това е едно минало несвършващо и повтарящо се, както казва една книга, излязла наскоро (сборникът с текстове "Минало несвършващо" на преподаватели и студенти от Нов български университет - бел.авт.). Дистанцията е къса, не сме скъсали с този период. Опасенията на всички нас са, че все още не сме затворили страницата", разсъждава над причините за интереса доц. д-р Мартин Иванов. И дава обяснение защо е важно да дигитализираме миналото: "Смисълът на подобни публикации според мен е не на 9 септември или на други дати, политици от ляво или от дясно да ни предоставят техните прочити на миналото, а всеки човек да има възможност да се порови и сам да започне да си изгражда представа за него."

"Това е огромен скок в достъпността на държавните архиви и е нещо, което се прави за пръв път у нас. Зад него стоят огромни усилия, тъй като технически качването на толкова много информация онлайн е страшно сложно и трудоемко", коментира пред "Капитал" разследващият журналист и изследовател на архивите на комунизма Христо Христов. Създателят на сайта за фотографии от миналото "Изгубената България" Пейо Колев също отчита това начало на дигитализацията като положителна, но и много закъсняла стъпка. "Амбициозно беше обявена за революция, но е по-скоро аматьорско като резултат на този етап", коментира той. Според Колев основният проблем пред дигитализацията на архива все още е, че се правят спорадични акции, а липсва цялостна стратегия кое как се качва онлайн и кога. "Важно е миналото да е достъпно, за да може да се използва като знание, но не само комунистическият период е интересен. В нашата група във Facebook, която се състои от над 10 хиляди души, хората много повече се вълнуват от периода на 20-те и 30-те години на XX век и особено XIX век", допълва той.  

С детски стъпки

Досега достъпът до документите от близкото и по-далечното минало е минавал през офлайн читалнята на "Архивите" - място, което са посещавали предимно историци, студенти и журналисти. Излишно е да казваме, че когато са на един клик разстояние, те автоматично стават по-търсени от много по-широк кръг от хора. Според доц. д-р Мартин Иванов "Архивите говорят" е първият проект за масова дигитализация на образи в България. Такива мащаби е достигала може би само Националната библиотека, която на етапа е качила онлайн около 230 хиляди файла - предимно старопечатни и редки издания, славянски и чуждоезични ръкописи, документи на Ориенталския отдел, картографски елементи и български вестници и списания от периода 1844 - 1944 г. В същото време България продължава да е страната с най-малко качено съдържание в дигиталната библиотека на ЕС Europeana.

През март 2011г. доц. д-р Мартин Иванов поема поста на председател на ДАА с убеждението, че сме безкрайно закъснели с цифровизацията на архива си, и с амбицията да доведе докрай тази задача по време на мандата си. Година и половина по-късно той съобщава с усмивка, че се е простил с тази романтична идея. Защо? Представете си 100-километрова линия с кутии, пълни с документи,  която тръгва от центъра на София и стига до центъра на Пловдив - долу-горе това представлява обемът на държавния архив в момента. По грубите изчисления на директора със сегашния финансов и човешки капацитет на агенцията ще бъдат необходими около 40 години, за да се дигитализира цялото съдържание. "Или трябва да се превърнем в най-големия работодател в страната", шегува се доц. д-р Мартин Иванов.

Затова започват с малки стъпки. Първо правят преценка кои документи ще се радват на най-голямо внимание, така че да си заслужава инвестицията в дигитализирането им. "След като не можем да сканираме 100-те километра линейна документация, по-добре да сканираме на малки части онези документи, които да ни донесат позитивен образ. За архивите това е изключително важно, защото през образа минава и финансирането", коментира председателят на агенцията.

Годишният бюджет на ДДА е около 7 млн. лева, като 6 млн. лева от тях отиват за заплати на служителите. Текущата издръжка на институцията е около 580 хиляди лева, а за капиталови разходи остават около 610 хиляди лева. С тях обаче агенцията се грижи за поддръжката и на 58-те сгради, с които разполага в страната. Агенцията сама финансира процеса по дигитализирането на архива. По думите на директора европейски средства за подобни дейности не се отпускат. "В България няма национално финансиране, с което да се дигитализират образи. Няма организирана инфраструктура, през която тези неща да се случват. Всичко е въпрос на опълченски усилия на единици - на няколко библиотеки и на националния архив", коментира доц. д-р Мартин Иванов. Той казва, че му е трудно да изчисли колко е струвал процесът по цифровизация досега, тъй като той минава през заплатите на около 10-ина служители, които са ангажирани с него. Но по груби сметки дигитализирането на около 70 хиляди листа документи излиза между 50 и 70 хиляди лева.

За да може да се справи с нормата и времето, което си поставя за дигитализирането на първите колекции с документи, Агенцията мобилизира и част от териториалните си дирекции в Благоевград, Пазарджик, Ловеч, Хасково, Кърджали, Пловдив и Смолян. Сканираните документи се транспортират по пощата на DVD-та. "Сега тепърва стартира нашата информационна система, която позволява да се качват образите директно там и те да бъдат видими и тук, в София. Да няма нужда от подобни начини на транспортиране", обяснява председателят на ДАА.

Най-голямата спънка пред дигитализацията засега обаче е липсата на качествена техника. Агенцията разполага с един-единствен многопрофилен скенер. На него се сканират документи с размери, различни от стандартния, или такива, които са в лошо състояние и са преминали през процес на реставрация. За всичко останало се използват полуамортизирани офисни скенери. Не им достигат средства и да закупят допълнително пространство за съхранение на дигиталните образи. Не разполагат и със софтуер за управление на качеството. Доц. д-р Мартин Иванов разказва, че неведнъж е търсил съдействието на бизнеса за осигуряването на техника и софтуер, но до момента нито една компания не е откликнала.

Той би искал някой ден България да стигне един от дигиталните шампиони на Европа Естония. В техния национален архив има само двама души, ангажирани с процеса по цифровизация на документите, които качват онлайн около 2.5 млн. страници на година, но разполагат с много по-качествена и професионална техника за целта.

Тук дигитализацията засега се случва на по-бавни обороти и по леко старомоден начин, но това не обезсърчава екипа. На 5 октомври ще тръгне другият сайт от поредицата "Архивите говорят", който ще бъде посветен на 100-годишнината от Балканската война. В него ще бъдат качен списък на всички загинали българи в Балканската и Междусъюзническата война (общо около 48 хиляди души). За да бъде достъпен той онлайн, агенцията наема няколко души по програмите за временна заетост, които да наберат на компютър имената на войниците от гигантските тефтери на Министерството на войната от 20-те години на миналия век. В тях имената са били изписани на ръка, на стария правопис и поради тази причина трудно четими. Сайтът ще дава възможност да се търси по първо, второ и трето име, както и по старо или ново име на мястото на раждане. "Хората ще могат да възстановят прекъснатите си родови нишки", надява се доц. д-р Мартин Иванов.

Предвижда се също така скорошният старт на сайта, в който ще бъдат събрани полицейските досиета на известни личности от периода преди 1944 г., а планът за следващата година е да бъдат дигитализирани протоколите на ЦК на БКП и на Министерския съвет, както и да се изработи отделен сайт с колекция от над 10 хиляди ретро фотографии. Но докато ни разказва всичко това, директорът на архива не спира да търси сравнението с други страни. От 2015 г. например администрациите на Дания и Норвегия спират да произвеждат хартиени документи. Те ще бъдат само в електронен вариант, ще се качват на гигантски правителствен сървър и ще им се задава дата, след която да преминават автоматично към националния архив. "Надявам се след 10 или 15 години от най-нискотехнологичната част на българската администрация архивите да станат една от най-високотехнологичните. И при нас да не идват само историци", усмихва се доц. д-р Мартин Иванов.

4 коментара
  • Най-харесваните
  • Най-новите
  • Най-старите
  • 1
    gligi avatar :-|
    gligi
    • - 4
    • + 8

    "по груби сметки дигитализирането на около 70 хиляди листа документи излиза между 50 и 70 хиляди лева"

    Това е нелепо, дори ако приспаднем 10 000 лв за ултра-специален скенер, остават 40-60 000 за самото сканиране. Един човек, без да си дава зор, за ден ще сканира 1000 страници (хората прочитат по толкова за изпит, или поне едно време го правеха). За 70 работни дни ще се справи с всички документи, това са има-няма 4 месеца, като включим националните празници, отпуски и т.н. Пита се в задачата: получава ли сканьорът 10-15 000 лв месечна заплата или някой ни прави на луди? Аааа, то си пишело - "10-ина служители, които са ангажирани с него", значи на един сканьор се падат 9 души администрация, по 1000 лв заплати, плюс ДМС, вързахме бюджета. Може ли уважаемите архиватори да отделят 5 минути да си сканират ведомостта?!

    пп. Убеден съм, че много фирми ще се радват да предложат тази услуга на десетки пъти по-ниска цена.

    ппп. Скенер за 10 000 лв сканира по над 70 страници в минута! 1000 минути са 16 часа и 2/3!!!

    Нередност?
  • 2
    jonson avatar :-|
    jonson
    • + 4

    [quote#1:"gligi"]Скенер за 10 000 лв сканира по над 70 страници в минута! [/quote]
    Сканира, ама ако са новички листа и са еднакви на размер. Архивите са на листа стари, изпомачкани и крехки. При това положение някои трябва да се слагат на стъклото ръчно и лист по лист, защото подаващото устройство ще ги захапе накриво и изпомачка.
    За сметка на това, твърдението, че нямали място да записват сканираните страници е меко казано съмнително. Една страница А4, записана на tiff с loseless компресия не е по-голяма от 3 MB (за бяло с текст, обикновено е към 1.5 MB, за jpeg пак e 1.5 МВ). Един диск от 3 терабайта с цена 330 лева може да побере между един и два милиона сканирани страници.

    Нередност?
  • 3
    simon40 avatar :-|
    simon40
    • + 2

    Стари книги и документи се сканират със специализирани book scanners. Цената на най-евтин такъв е около 30 000 евро. Защо струват толкова? Заради скъпата оптика, те не работят на принципа на плоския скенер. Имат везна коята държи книгата отворена колкото трябва и я предпазват от разпадане на страниците. Софтуер който автоматично изравнява изображението следствие изкривяването на листите от разгърнатата книга... и много други.
    Тук може да видите как изглежда един такъв: http://www.imageaccess.de/index.php?lang=en&page=ScannersBE4-SGS-V2
    Що се отнася за съхранението, да се пацят тези неща на външен диск е несериозно. Ако искаме те гарантирано да се запазят и в същото време да имаме достъп до тях е най-добре да се изпозва специализирано сървърно решение с няколко диска които се бакъпват един друг постоянно. Сами се сещате че сървър от нисък клас струва към 8000 лева.

    Нередност?
  • 4
    jonson avatar :-|
    jonson
    • - 1

    До коментар [#3] от "simon40":
    Аз тъкмо се възмутих, че калкулират по лев на страница и ето ти решение, при което ще отидат към 2 лева страницата!

    Хайде да смятаме:
    Задача: да се сканират 70 000 страници.
    Решение:
    3 МФУ HP Officejet 4500 All-in-One А4, 3х141.60=425 лева
    3 компютъра х 800 лева = 2400 лв
    3 заплати с осигуровките х 1000 лева = 3000 лв
    1 наем 300 лв = 300 лв
    Ток 200 лв
    Какво-ли-не = 675 лв
    Общо 7000 лв

    Едно МФУ може да сканира поне 3 страници за минута. Нищо, че го дават 28. ADF - това е подавачката на листата в скенера, понякога с нея става, друг път - не, но 20 секунди средно на страница са напълно реални и с достатъчен резерв. 3 човека за минута сканират 9 страници. На час - 540 страници. При 6 часа ефективна работа производителността е 3240 страници. Т.е. за 22 работни дни (1 календарен месец) 70000 страници ще бъдат сканирани срещу разход от 7000 лв. При това компютрите и МФУ-тата ще си останат.

    Какви 30000 евро за скенер при теб, какви 70000 лв. с при ДАА????
    Очевидно е, че ДАА са качили себестойноста 10 пъти, твоят скенер се рентира при заплата на оператор 5000 лв на месец и задача от милиони страници.

    Когато мястото в наличен сървър свърши какво правиш? Купуваш нов сървър или добавяш диск на наличния? Ако ти трябва backup - купуваш 2 диска.


    Нередност?
Нов коментар