RegistrDigitalizaceCZ
evidence digitalizovaných dokumentů a sledování procesu zpracování

 

 

URL adresa:               http://registrdigitalizace.cz/                      Informační stránky RD

Kontaktní e-mail:        rdcz@nkp.cz

 

Zasílání importních souborů MARCXML

Instituce, která zvolí tuto formu, export dat z vlastního katalogu, musí před zahájením zasílání požádat o přístup (nahlásit zvolené heslo a IP adresu, odkud budou data odesílána) a zaslat jako přílohu mailu vzorek dat. Pokud chce mít v RD údaje na úrovni předloh a systém jí neumožní vytvořit odpovídající formát obsahující i údaje k jednotkám (část/rok/ročník), nemůže takto hlásit seriály a vícesvazkové publikace, pouze zasílat souhrnné hlášení záměru nebo hotové digitalizace. Pro rozpis periodik je pak třeba použít tabulku excel. Souhrnně hlásit periodika i jako probíhající digitalizaci (pokud se bude digitalizovat celý titul) samozřejmě možné je. Pokud však probíhá hlášení dvoufázově či třífázově, je nutné, aby při opakovaném hlášení byl zvolen stejný způsob rozdělení dokumentů na záznamy, tj. buď sumárně na titul, nebo jako rozpis svazků.

 

Pro knihovny se systémem Aleph je k dispozici exportní skript, který ošetřuje jak údaje z jednotek, tak přívazky.


Instituce, které spolupracují se Souborným katalogem ČR (SKC) a měly by problém s xml exportem z vlastního katalogu, mohou využít novou
službu souborného katalogu – požádat o vyexportování záznamů, kde patřičným způsobem doplní údaje o své digitalizaci. Doplňování údajů přes formulář je často méně pracné než vytváření excelovské tabulky, zvlášť je-li třeba stejně žádat o přidělení ČČNB.

 

Jestliže se knihovna rozhodne posílat hlášení exportem z katalogu, musí zajistit, aby záznamy v katalogu obsahovaly ČČNB (pokud ho mají mít).

 

Umísťování a pojmenování souborů:

 

Soubory se umísťují na ftp.nkp.cz, do podadresáře importMARCXML v adresáři příslušné instituce. Přihlašovacím loginem je vždy sigla s písmenem r na konci (např. boa001r).  

 

Importní soubory musejí striktně dodržovat názvovou konvenci:

 

sigla_druhhlášení_datum/upřesnění.přípona
(na velikosti písmen nezáleží, může být i datum i další upřesnění oddělené podtržítkem)

Kódy označující druh hlášení:

z=záměr digitalizovat, plánovaná digitalizace, rezervace titulu déle dopředu

p=probíhající digitalizace, dokument ve zpracování nebo připraven k digitalizaci (dodávají se údaje k předlohám)

h=hotová digitalizace (zdigitalizováno)


Příklady:aba001_z_121001.xml,boa001_p_2012_per1.xml

 

Pro předběžnou kontrolu „na duplicitu“ bez importu dat je možno stejným způsobem poslat soubor, jemuž se za poslední podtržítko před příponou přidá označení „test“ (např. boa001_z_2012_test.xml)

 

Formát záznamů:

 

Data musejí být v kódování UTF-8, ve standardním MARCXML formátu, z něhož se přebírají pouze vybraná pole potřebná k identifikaci dokumentu (nikoli např. věcný popis, poznámky apod.). Pokud je třeba dodat údaje k jednotlivým svazkům (rokům a ročníkům periodik, částem vícedílných publikací), které nejsou součástí bibliografického záznamu, musí být tento formát obohacen o pole ITM (opakovatelné pro každou „jednotku“) s následujícími údaji:

 

Čárový kód = ITMb

Signatura = ITMc

Poznámka k exempláři = ITMd

Část / Ročník periodika = ITMv

Číslo periodika = ITMi

Rok periodika = ITMy

 

Dalším speciálním polem, které by mělo být součástí záznamu, je FMT. V případě seriálu má mít hodnotu SE (odpovídá hodnotě s v návěští), v případě monografie=knihy BK. Záznamy jsou přijímány, i když toto pole neobsahují, ale je velmi žádoucí. (Výhledově by měl být importní program schopen si tento údaj vygenerovat podle návěští.)

Ostatní kódy: RP = staré tisky a rukopisy (do r. 1800), MU = hudebniny, MP = mapy, GP = grafika

Ukázka záznamu:

 

<?xml version="1.0" encoding="utf-8"?>

<collection xmlns="http://www.loc.gov/MARC21/slim" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

   <record>

      <leader>     nam a22      a 4500</leader>

      <controlfield tag="FMT">BK</controlfield>

      <controlfield tag="001">cpk20010000526</controlfield>

      <controlfield tag="003">CZ PrNK</controlfield>

      <controlfield tag="005">19940500000000.0</controlfield>

      <controlfield tag="008">830408s1982    xr           u000   cze</controlfield>

      <datafield tag="015" ind1=" " ind2=" ">

         <subfield code="a">cnb000000526</subfield>

      </datafield>

      <datafield tag="040" ind1=" " ind2=" ">

         <subfield code="a">ABA001</subfield>

         <subfield code="b">cze</subfield>

         <subfield code="d">ABA001</subfield>

      </datafield>

      <datafield tag="100" ind1="1" ind2=" ">

         <subfield code="a">Kábrt, Jiří­,</subfield>

         <subfield code="d">1928-</subfield>

         <subfield code="7">jk01052351</subfield>

         <subfield code="4">aut</subfield>

      </datafield>

      <datafield tag="245" ind1="1" ind2="0">

         <subfield code="a">Slovní­k teorie a metodiky bibliografie /</subfield>

         <subfield code="c">Jiří­ Kábrt</subfield>

      </datafield>

      <datafield tag="260" ind1=" " ind2=" ">

         <subfield code="a">Praha :</subfield>

         <subfield code="b">Státní knihovna ČSSR,</subfield>

         <subfield code="c">1982</subfield>

      </datafield>

      <datafield tag="300" ind1=" " ind2=" ">

         <subfield code="a">102 s. ;</subfield>

         <subfield code="c">21 cm</subfield>

      </datafield>

      <datafield tag="910" ind1=" " ind2=" ">

         <subfield code="a">ABA001</subfield>

      </datafield>

      <datafield tag="ITM" ind1=" " ind2=" ">

         <subfield code="b">1002200227</subfield>

         <subfield code="c">I 264362</subfield>

         <subfield code="d"/>

         <subfield code="v"/>

         <subfield code="i"/>

         <subfield code="y"/>

      </datafield>

      </record>

</collection>

 

Podrobnější návod k exportnímu skriptu pro knihovny se systémem Aleph

 

Je třeba stáhnout balíček export_rd.tar.gz obsahující skript + další potřebné soubory a podle následujícího návodu provést příslušné změny v souborech stávajících.

 

Varianty použití skriptu:

 

1.    Export na úrovni titulu, bez údajů z jednotek:
Použití:
- pro hlášení digitalizačního záměru (plánované digitalizace, rezervace) na úrovni titulu
- u probíhající digitalizace pro hlášení jednosvazkových monografií; pro hlášení souborů a seriálů tehdy, když knihovna nepotřebuje rozpis svazků pro dodavatele a nepovažuje za nutné uvést signaturu, čár. kód apod.
- u hotové digitalizace hlášené souhrnně dodatečně (měl by být zdigitalizovaný kompletní titul)
Vstupní soubor: seznam systémových čísel (ukládací soubor získaný např. přes p_print_01, nebo online uložením souboru vyhledaných/vybraných  záznamů na server; pokud by se vytvářel ručně, řádky musejí obsahovat jméno báze, tedy např. 000563587NKC01)
Výstup: MARCXML obohacený o FMT a SYS
Tato varianta nezpracovává přívazky.

 

2.    Export s údaji z jednotek
Použití: standardně pro probíhající/hotovou digitalizaci, je-li zájem evidovat jednotlivé svazky
Vstup, který určuje vybrané jednotky:
- jednotky jsou vypůjčené na určité uživatelské konto
- vstupní soubor - seznam čárových kódů
- vstupní soubor - seznam čísel jednotek, vyhledaných např. pomocí p_ret_adm dle určitého příznaku
Výstup: MARCXML obohacený o FMT, SYS a ITM (=údaje z jednotek)
Zpracuje i přívazky, jsou-li řádně propojené pomocí LKR (vytváří pomocná pole  790 a 791).

 

Potřebné soubory:

·        základní skript: export_rd (lze umístit kdekoli, viz proměnná hdir)

·        fix pro úpravu exportu: exp_rd.fix (v adresáři $data_tab/import příslušné báze)

·        transformační šablony:  export_rd_...xsl (v témže adresáři jako základní skript)

Navíc pro nastavení exportu  s jednotkami jako online služby:

·        služba: p_custom_xx  (v adresáři $aleph/proc ) - přebírá parametry a volá proceduru export_rd – službu lze pojmenovat dle potřeby
(pro verzi 18 je nutno použít  p_custom_xx_v18)

·        formulář: p-custom-xx.xml  ($alephe_root/pc_b_cze) – příp. možno doplnit implicitní hodnotu BIB báze

Doplnění stávajících alephovských souborů:

tab_expand
(
$data_tab příslušné báze) – přidat řádky:
EXP-RD     expand_doc_sysno
EXP-RD     fix_doc_do_file_08             exp_rd.fix

·        navíc pro online službu:
menu-catalog.xml a/nebo menu-circ.xml ($alephe_root/pc_b_cze) - přidat řádky:
<item>
<display>Export dat pro Registr Digitalizace</display>
<file>p-custom-xx</file>
</item>

 

Lokální nastavení v základním skriptu export_rd:
- nadefinovat proměnnou hdir = cesta do adresáře, kde budou všechny soubory export_rd… (včetně šablon)
- nadefinovat proměnnou saxon  = cesta k XSLT processoru (standardně je v $aleph_product/saxon/)  kompatibilniho s XSLT 2.0 (např. Saxon 8.x nebo 9.x, ne starší!)
Pokud na serveru není, dá se např. získat z klienta, z Aleph20\Alephcom\bin\saxon8.jar (kopírovat binárně).
- opravit cestu /exlibris/aleph/u20_1/alephe/aleph_start  podle aktuální instalace
- dle potřeby je možno doplnit filtr na exportované záznamy (ukázka:  zaremovaný filtr na pole BAS)

Lokální úprava fixu exp_rd.fix:
- přepsat XXX001 siglou knihovny (v řádku s FMT  ADD-FIELD  910)
- přepsat řetězec xxxx.xxx.xx (v řádku s polem 856  DELETE-FIELD-COND) řetězcem z adresy pro umístění digitálních dokumentů, např. pro NK je to kramerius.nkp.cz – všechny ostatní výskyty pole 856 se budou mazat
- případně odstranit další lokální pole (pomocí DELETE-FIELD).


Spouštění skriptu export_rd:

Standardně  se dvěma parametry:
$1 = kód BIB báze
$2 = soubor jednotek/uživatelské konto/soubor BIB záznamů:
varianty pro soubor  jednotek:
- soubor čísel jednotek – s příponou _itm
- soubor čárových kódů – s příponou _bar
další varianty:
- ID uživatelského konta, kde jsou jednotky vypůjčeny
- seznam syst.čísel (BIB) pro export samotných BIB záznamů  bez jednotek – s příponou _bib
  
(řádky v souboru musejí obsahovat jméno báze, např. 000563587NKC01)

csh -f  export_rd <kod_bib_baze>  <soubor_jednotek/uzivatel_konto/ soubor_BIB_zaznamu >

 

Výstupem je soubor …_bib.xml v $data_print (!!)  příslušné BIB báze
V $data_scratch zůstávají pracovní soubory, které všechny začínají jménem zadaného vstupního souboru (bez "_itm" a "_bar"), resp. uživ. konta.

Skript lze samozřejmě doplnit o přejmenování výstupního souboru podle konvence a jeho umístění do patřičného adresáře na ftp, nebo ho začlenit do „odesílacího skriptu“, který umožní posílání hlášení do RD více zautomatizovat.

 

Poznámka: Pro jiné účely je možné z příkazového řádku skript spustit s třetím parametrem „mods“. V tom případě je v $data_print vytvořen další soubor "..._mods.xml" se záznamy ve formátu MODS.