Rodzina systemu MARC.doc

(87 KB) Pobierz

UNIWERSYTET ŁÓDZKI

Automatyzacja

RODZINA SYSTEMU MARC

Wstęp

Niniejsza praca ma na celu przybliżenie odbiorcy historii i zastosowania formatu MARC i od niego pochodnych, stosowanych podczas automatyzacji bibliotek różnego typu w różnych krajach świata.

Na podstawie publikacji Alaina Jacquessona Automatyzacja bibliotek, Elżbiety Górskiej Komputeryzacja i informacja elektroniczna w bibliotekach publicznych oraz Aleksandra Radwańskiego Jak komputeryzować bibliotekę. Poradnik dokonana została krótka charakterystyka kolejnych elementów systemu: formaty MARC, MARC II i jego ewolucje, IFLA i UNIMARC, niemiecki format MAB, kartoteki wzorcowe oraz zastosowanie, kompatybilność i przyszłość formatów.

Praca zakończona jest wnioskami dotyczącymi przyszłości rodziny systemu MARC oraz możliwościami jej wykorzystania we współczesnych procesach automatyzacji.

Format MARC, jego ewolucja i ograniczenia

Ogólnie formaty narodziły się w latach 60. XX w. w związku z koniecznością nowych rozwiązań w zakresie wymiany danych między bibliotekami i ośrodkami bibliograficznymi. Celem pierwszych formatów było umożliwienie przekazywania danych katalogowych.

Historia formatu MARC rozpoczyna się w 1964r., kiedy to Biblioteka Kongresu, przy wsparciu finansowym Council on Library Resources w wysokości 145 tys. dolarów, zleciła firmie Inforonics zadanie przestudiowania możliwości przekształcenia iformacji zawartej w jej katalogach kartkowych w informację czytelna maszynowo. W listopadzie tego samego roku Inforonics potwierdziła taką możliwość. W czerwcu 1965r. zespół pod kierunkiem Henrietty D. Avram przedstawił raport pt. A Proposed Format for a Standardized Machine-Readable Catalog Record. Na tej podstawie powstał nowoczesny format, który Biblioteka Kongresu nazwała MARC (Machine Readable Cataloguing).

MARC został poddany pod krytykę bibliotekom różnego rodzaju, biorącym udział w projekcie. Głównym celem tego projektu była ocena ogólnej wartości dystrybucji danych w formie czytelnej dla komputera. Liczne uwagi doprowadziły w 1968r. do powstania MARC II, który stał się amerykańską normą na dane katalogowe czytelne dla komputera. Do końca 1969r. koncepcję MARC II przyjęło 80 biblioteka amerykańskich oraz Wielka Brytania.

Projekt MARC miał kilka ściśle określonych celów:

- niezależność danych w stosunku do komputera,

- niezależność danych w stosunku do języka programowania

- uniwersalność bibliotek

- różne procesy w bibliotece (czynności biblioteczne)

Format MARC uwzględnia również naturę i funkcje każdego elementu składającego się na opis bibliograficzny. Bierze pod uwagę całość informacji i pozwala na:

- selekcjonowanie

- sortowanie

- drukowanie

- indeksowanie

- wyszukiwanie

- poprawianie

Format bierze pod uwagę także całość kodów katalogowych stosowanych w normalizacji. Przewiduje stosowanie różnych sposobów kodowania informacji: Klasyfikację Dziesiętną Deweya lub klasyfikacji National Library of Medicine. W tym samym czasie wiele bibliotek stworzyło własne formaty, np. format CEPT [1].

Na każdy format składają się 3 elementy: struktura, sposób kodowania lub identyfikacji danych oraz zawartość, czyli dane właściwe. Dane bibliograficzne, będące zawartością rekordu przedstawione są w formie zgodnej z postanowieniami stosownych przepisów katalogowania.

W skład struktury rekordu w formacie MARC wchodzą:

- etykieta rekordu – zawiera informacje zakodowane potrzebne do przetwarzania informatycznego

- tablica adresów – zawiera adresy informatyczne wszystkich pól stałej i zmiennej długości

- pola informacyjne – od 001 do 009 mają stałą długość i zawierają zakodowane informacje, które mogą być wykorzystywane w szybkim przetwarzaniu informacji

- pola danych – mają zmienną długość, w większości są powtarzalne i najczęściej są fakultatywne.

Z czasem zauważono, że format MARC stawia na pozycji uprzywilejowanej funkcję różnych informacji, a nie ich rodzaj. Oznacza to, ze różne strefy wprowadzane są w takim porządku, w jakim występują w AACR [2] lub ISBD [3]:

- 100 – autor

- 245 – tytuł

- 260 – adres wydawniczy

- 440 – seria

Zgodnie z typem przetwarzania danych, które pragnie się realizować, można łatwo pogrupować maszynowo różne informacje o tej samej naturze:

- 100 – autor – hasło główne

- 400 – redaktor serii – hasło główne

- 600 – hasło przedmiotowe – nazwa osobowa

- 700 – autor – hasło dodatkowe

- 800 – redaktor serii – hasło dodatkowe

Powstały w 1968r. format MARC musiał ewoluować, choćby po to, by uwzględnić ewolucję nośników informacji (kasety magnetofonowe i magnetowidowe, CD-ROMy, itp.). Od kilkunastu lat format ten umożliwia także określenie źródła danych z pewnych pól rekordu. Ma on jednak też pewne ograniczenia. Pierwszym z nich jest podwójny cel, jaki miały zapewnić przepisy ISBD, tj. pozwolić na uzyskanie jednego opisu o dwóch zastosowaniach (opis bibliografii narodowej, opis w katalogu bibliotecznym). Drugie ograniczenie dotyczy relacji między opisami. Pierwotnie autorzy wyobrażali sobie projekt MARC jako kartotekę „płaską”, linearną a przecież istnieje wiele relacji różnego rodzaju. Barbara B. Tillet zaproponowała typologię relacji, jakie powinny znaleźć się w kolejnej edycji formatu MARC:

1) relacje ekwiwalencji – łączące kopie dokumentu na różnych nośnikach

2) relacje derywacyjne – łączące jednostkę bibliograficzną i wersje zmodyfikowane pochodne od niej (relacje takie, nazwane horyzontalnymi, przewidziano w formacie UNIMARC)

3) relacje deskryptywne – łączące dokument z jego recenzjami, komentarzami, itd.

4) relacje całość-część – łączące element składowy jednostki bibliograficznej z tą jednostką lub dokumentem. Występuje to w przypadku np. kolekcji (relacja ta została również przewidziana w formacie UNIMARC, jako relacja wertykalna)

5) relacje towarzyszenia – łączące jednostkę bibliograficzną z dokumentem towarzyszącym (np. płyta lub kaseta dołączona do książki, czasopisma, itp.)

6) relacje sekwencyjne – łączące jednostki bibliograficzne następujące po sobie, lecz niezależne od siebie ( w UNIMARC nazywane relacjami chronologicznymi)

7) relacje cech wspólnych – łączące jednostki bibliograficzne nie połączone innymi relacjami niż cechy wspólne (np. opisy tego samego autora, o wspólnym języku, miejscu publikacji, itd.)

Prace biblioteki kongresu śledzone były przez liczne biblioteki z całego świata. Z czasem każde z tych państw stworzyło własne wersje formatu MARC, wszystkie jednak oparte były na zasadach działania przewidzianych w pierwotnym wydaniu. I tak, jako jedna z pierwszych, studia nad formatem MARC prowadziła British Library na potrzeby British National Bibliography. Zaproponowano wówczas format zwany BNB MARC, który w 1975r. zmienił nazwę na UK-MARC. Biblioteka Narodowa w Paryżu zaproponowała format MONOCLE (1970), który był rozwinięciem formatu BNB MARC. W Szwajcarii grupa, której zadaniem była automatyzacja Biblioteki Kantonalnej i Uniwersyteckiej w Lozannie, stworzyła na podstawie MONOCLE’a strukturę danych, która miała być wykorzystywana w systemie SIBIL – Système intégré pour les bibliothèques universitaires de Lausanne (1971). W latach 80. SIBIL był jednym z najczęściej używanych systemów w Europie. W Kanadzie pojawił się format CAN-MARC (1972), w Australii AUS-MARC (1972), we Włoszech ANNA-MARC (1978), w Katalonii CAT-MARC (1987), w Danii DAN-MARC (1975), w Finlandii FIN-MARC, w Hiszpanii IBER-MARC (1976), w Japonii JAPA-MARC, w malezji MALMARC (1978), w Belgii MARC-BR, w Norwegii NORMARC, w RPA S.A.-MARC (1977), w Singapurze SINGMARC, w Szwecji SWEMARC (1980) i wiele innych.

Obfitość tych prawie podobnych formatów zmusiła do ich uzgodnienia. Pracy tej podjęła się w 1972r. grupa INTERMARC. Składała się ze specjalistów francuskich, belgijskich, holenderskich, szwajcarskich i in. W roku 1975 grupa ta opublikowała podręcznik dla książek, w 1977 dla wydawnictw ciągłych – INTERMARC (S), a w 1982 propozycję dotyczącą kartotek wzorcowych. Międzynarodowe postępy formatu INTERMARC zostały przerwane przez przyjęcie na szeroka skalę UNIMARCa i dalsze pilotowanie prac przez IFLA. Prace nad INTERMARC przejęła w całości BN w Paryżu.

IFLA [4] i UNIMARC

Prawdziwe efekty w zakresie normalizacji formatów na szczeblu międzynarodowym przyniosły prace IFLA, która od 1971r. zajmowała się harmonizacją krajowych formatów MARC. Pierwszym istotnym krokiem było opublikowanie podręcznika UNIMARCa w 1977r.

W pracach nad formatem UNIMARC wzięli udział uznani specjaliści, ale korzystano także z doświadczeń wielu bibliotek narodowych, zwłaszcza Biblioteki Kongresu, British Library i Biblioteki Królewskiej w Brukseli.

W formacie UNIMARC różne funkcje opisu bibliograficznego są od siebie precyzyjnie oddzielone. Znajduje się tam więc 10 bloków, z których każdy odpowiada jednej funkcji:

- BLOK 0 = element identyfikacji

- BLOK 1 = strefy informacji kodowych

- BLOK 2 = blok opisu

- BLOK 3 = uwagi

- BLOK 4 = blok powiązań

- BLOK 5 = blok tytułów połączonych (prac współwydanych)

- BLOK 6 = analiza treści

- BLOK 7 = odpowiedzialność intelektualna

- BLOK 8 = nie zdefiniowany

- BLOK 9 = blok zarezerwowany na dane lokalne

W stosunku do USMARC w formacie UNIMARC pojawiły się dwa udoskonalenia: pierwsze z nich dotyczy możliwości stworzenia relacji między rekordami [5], natomiast drugie miało dać możliwości połączenia zawartości pewnych stref z kartotekami wzorcowymi.

W 1985r. duże biblioteki podjęły decyzję o wzajemnej wymianie bieżących bibliografii narodowych w formacie UNIMARC. W 1988r. Biblioteka Narodowa w Paryżu i British Library wyprodukowały wspólnie pierwszy eksperymentalny dysk optyczny w formacie UNIMARC. Jego sukces został zapewniony odkąd producenci komercyjnych systemów komputerowych dla bibliotek wprowadzili kompatybilność z formatem UNIMARC.

Format ten rozpowszechnił się również we Francji i to z kilku powodów. Pierwszy to fakt dostarczania opisów przez Bibliotekę Narodową, zwłaszcza na jej CD-ROMie. Drugi powód to to, że wielu producentów systemów informatycznych dla bibliotek (np. OPSYS, DYNIX) oparło swą politykę handlową na wykorzystaniu tej normy.

W 1985r. Stowarzyszenie Bibliotekarzy Szwajcarskich podjęło decyzję o zaadaptowaniu formatu UNIMARC do ewentualnej wymiany danych bibliograficznych między różnymi systemami, zwłaszcza między SIBIL a ETHICS. Od 1989r. SIBIL produkuje taśmy UNIMARC.

Niemcy i format MAB

W Niemczech stosowane są odrębne zasady opisu bibliograficznego zwane RAK [6]. W 1971r. przeprowadzono w Deutsche Bibliotek pierwsze analizy, które doprowadziły do wniosku, iż format MARC nie nadaje się do zaadaptowania na potrzeby tego kraju. Dlatego w 1973r. stworzono od podstaw niemiecki format MAB-1 [7]. Wśród interesujących możliwości formatu MAB wymienia się realizację formatu w dwóch „kartotekach”: pierwszy zespół zawiera opisy bibliograficzne, a drugi nazwy autorów. Była to jedna z pierwszych prób tworzenia kartotek wzorcowych.

W 1988r. Deutsche Bibliotek we Frankfurcie nad Menem stała się centrum koordynacji wymiany w formacie UNIMARC. Od tego roku niemiecka biblioteka narodowa może również udostępniać swoją produkcję bibliograficzną w formacie UNIMARC. W 1990r. Deutsche Bibliotek przeprowadziłą ocenę nowego systemu i rozważała przez pewien czas możliwość ewentualnego przejścia na format UNIMARC. Jednak pod wpływem silnej presji konstruktorów format MAB jest utrzymywany. Z czasem został on jednak poddany ważnym modyfikacjom i obecnie nosi nazwę DB-MAB-90. Taśmy magnetyczne w tym formacie produkowane są przez Deutsche Bibliotek od 1. grudnia 1991r.

4. Kartoteki wzorcowe

Od dziesięcioleci wielkie ośrodki bibliograficzne, takie jak Biblioteka Kongresu czy Biblioteka Narodowa w Paryżu, próbowały znormalizować kontrolę haseł. W systemie zautomatyzowanym rezultaty takiej kontroli przybierają formę kartotek wzorcowych. Zasadniczo są one logicznie oddzielone od bazy bibliograficznej i mają służyć sprawdzaniu poprawności informacji wprowadzanych do bazy danych.

W praktyce kartoteki wzorcowe obejmują cztery grupy informacji:

a) przyjęte formy haseł, w postaci możliwie najpełniejszej

b) formy odrzucone haseł

c) odsyłacze orientacyjne, które wspomagają użytkownika w poruszaniu się po bazie danych, zwłaszcza w kartotekach wzorcowych haseł przedmiotowych

d) uwagi i dane uzupełniające pozwalają na wskazanie ewentualnych relacji między różnymi opisami wzorcowymi i podanie wykorzystanych źródeł informacji. Podobnie jak rekordy MARC opisu bibliograficznego, najnowsze wersje kartotek wzorcowych zawierają dodatkowe informacje zakodowane, analogicznie do informacji znajdujących się w strefie pól stałej długości w rekordzie bibliograficznym. Pozwalają one sortowanie wg dat, narodowości, języków, itd.

Kartoteki wzorcowe stosowane w systemach informatycznych zawierają nie tylko tradycyjne odsyłacze, jakie znajdują się w katalogach kartkowych, ale również formy przyjęte, zatwierdzone przez kompetentną instytucję.

Pierwsze kartoteki haseł wzorcowych dotyczyły haseł opisu rzeczowego, gdyż istniały słowniki haseł przedmiotowych i tezaurusy w formie komputerowej. Jeden z najstarszych systemów wzorcowych pochodzi z roku 1976 i powstał w Republice Federalnej Niemiec. Stworzyła go w Berlinie Staatsbibliothek Preuschnischer Kulturbesitz dla haseł korporatywnych. System GDK [8] w 1993r. liczył ponad 366tys. haseł. Od października 1990r. dołączono do niego także dane dotyczącej byłej NRD.

Prototyp kartotek wzorcowych, takich jakie znane są dziś, powstał w wyniku prac prowadzonych w New York Public Library. Efekty jej prac szybko wykorzystały inne biblioteki – stały się one podstawą wielojęzycznych kartotek wzorcowych w Kanadyjskiej Bibliotece Narodowej, w systemie DOBIS.

Szybko pojawiła się konieczność ujednolicenia zasad tworzenia kartotek wzorcowych, powstających w różnych miejscach. W związku z tym w 1981r. Biblioteka Kongresu zaproponowała normę na format wymienny kartotek wzorcowych.

Obecnie Biblioteka Kongresu w Waszyngtonie utrzymuje nie tylko dwie kartoteki wzorcowe, najważniejsze z istniejących obecnie, ale również ściśle sformalizowała ich strukturę w formacie szeroko dziś upowszechnionym. Kartoteki BK dostępne SA w postaci mikrofisz, taśm magnetycznych i dysków optycznych oraz w trybie online. Wydawane są także liczne podręczniki dokumentujące te kartoteki.

Kartoteki wzorcowe są zasadniczym narzędziem koordynacji w sferze danych bibliograficznych. Na przestrzeni lat ośrodki bibliograficzne różnych państw podejmowały prace nad własnymi kartotekami wzorcowymi, dodając do nich różne elementy dodatkowe. Te prace przyczyniły się w ostatnich latach do znacznego postępu w dziedzinie zinformatyzowanej kontroli bibliograficznej. Kartoteki wzorcowe odgrywają również niezastąpioną rolę w katalogowaniu kooperatywnym [9].

Zastosowanie, kompatybilność i przyszłość formatów

Formaty przeznaczone są do wymiany, dystrybucji i komunikacji danych bibliograficznych w formie czytelnej dla komputera. Aż do 1997r. transfery te były realizowane dzięki zastosowaniu taśm magnetycznych jako nośnika danych, ale sama idea formatu pozwala na zastosowanie bardziej nowoczesnych środków komunikacji, takich jak transfer plików przez sieci informatyczne.

Format zatem jest strukturą zewnętrzną w stosunku do użytkowanego systemu komputerowego. Struktura wewnętrzna może w pewnych przypadkach odpowiadać rozwiązaniom formatu MARC, ale większość współczesnych systemów bibliotecznych wykorzystuje systemy zarządzania bazami danych (SZBD) i dane organizowane są w nich zgodnie z SZBD.

Przekształcanie danych z jednego formatu na inny powoduje nieuchronnie mniej lub bardziej istotne straty informacji. W niektórych przypadkach automatyczne przekształcanie po prostu nie jest możliwe. Nawet nieznaczne transformacje z różnych formatów, których celem jest stworzenie katalogu kolektywnego, powodują równanie w dół, tj. dane są redukowane do najprostszego z formatów albo też istnieje duża niejednorodność w poziomie opisu między rekordami bibliograficznymi o różnym pochodzeniu, co w wyszukiwaniu wprowadza czynnik przypadkowości.

Formaty nigdy nie będą miały ostatecznej formy – zawsze będą musiały adaptować się do nowych typów dokumentów gromadzonych przez biblioteki. Pierwsza istotna ewolucja nastąpiła w związku z napływem dokumentów audiowizualnych w latach 60. Dziś trzeba katalogować dokumenty online i formaty muszą je uwzględniać.

W przyszłości formaty sformalizują nie tylko relacje między różnymi opisami bibliograficznymi, ale też przedmiotami, obrazami czy filmami, dokumentami prymarnymi a nawet rozdziałami w sposób podobny do hipertekstu. Zmierzać się będzie w ten sposób ku hiperkatalogom.

Zakończenie

Marc Chauveinc powiedział kiedyś „Współczesne formaty nie są już w centrum debat nad automatyzacją bibliotek i tak jest lepiej” [10]. Znane są ich ograniczenia i zalety. Bibliotekom pozostaje użytkować je jak najlepiej, gdyż bardziej istotne jest dziś wypracowanie np. szerokich strategii importu opisów w kontekście katalogowania retrospektywnego w wielkich bibliotekach niż kontynuowanie rozważań nad zaletami rozmaitych kodów.

Znaczenie systemu MARC i całej jego „rodziny” w procesie automatyzacji bibliotek jest nieocenione. Dzięki nim między bibliotekami panuje współpraca, co w końcowym jej efekcie znacznie ułatwia bibliotekarzom ich pracę, a użytkownikom wyszukiwanie informacji, dzięki licznym relacjom, zachodzącymi między poszczególnymi elementami opisu a uwzględnionymi w języku systemu MARC.

Polecane strony WWW

· Strona Biblioteki Kongresu http://www.loc.gov/marc/

· Dokumentacja MARC 21 http://www.loc.gov/marc/marcdocz.html

· Dokumentacja MARC 21 Lite http://www.loc.gov/marc/bibliographic/lite/

· Kurs MARC 21 (dla początkujących) http://www.lib.usm.edu/~techserv/MARC21Tutorial/marcfr.htm

Rodzina systemu MARC.doc

Wstęp

Format MARC, jego ewolucja i ograniczenia

IFLA [4] i UNIMARC

Niemcy i format MAB

4. Kartoteki wzorcowe

Zastosowanie, kompatybilność i przyszłość formatów

Zakończenie

Polecane strony WWW

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika:

Rodzina systemu MARC.doc

Wstęp

Format MARC, jego ewolucja i ograniczenia

IFLA[4] i UNIMARC

Niemcy i format MAB

4. Kartoteki wzorcowe

Zastosowanie, kompatybilność i przyszłość formatów

Zakończenie

Polecane strony WWW

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika:

IFLA [4] i UNIMARC