Start projektu Europeana Newspapers - Aktualności - Biblioteka Narodowa

EN

Start projektu Europeana Newspapers

17 europejskich instytucji, wśród nich Biblioteka Narodowa, rozpoczęło realizację projektu Europeana Newspapers. W ciągu najbliższych trzech lat instytucje te udostępnią za pośrednictwem serwisów internetowych portalu Europeana ponad 18 milionów stron gazet, głównie z pierwszego dwudziestolecia XX w. Portal Europeana umożliwia dostęp do milionów zdigitalizowanych książek, obrazów, filmów, obiektów muzealnych i archiwalnych dokumentów znajdujących się w kolekcjach europejskich instytucji kultury.

Projekt Europeana Newspapers finansowany jest ze środków Komisji Europejskiej w ramach Programu Ramowego na rzecz Konkurencyjności i Innowacji 2007–2013 (CIP-ICT PSP), a jego celem jest agregacja wysokiej jakości cyfrowych kopii gazet za pośrednictwem The European Library.

Każda z bibliotek uczestniczących w projekcie udostępni za pośrednictwem portalu Europeana pełnotekstowe wersje zdigitalizowanych gazet. Celem projektu jest umożliwienie bezpośredniego dostępu do treści gazet za pomocą specjalistycznego interfejsu portalu Europeana, pozwalającego na wyszukiwanie całych fraz lub poszczególnych słów w zdigitalitowanym tekście.

Projekt stanowi odpowiedź na wyzwania związane z digitalizacją prasy i dotyczy przede wszystkim udoskonalenia metod Optycznego Rozpoznawania Pisma (OCR – Optical Character Recognition), segmentacji artykułów i Optycznego Rozpoznawania Układu Strony (OLR – Optical Layout Recognition), rozpoznawania nazw (NER – Name Entity Recognition) oraz rozpoznawania typu strony. OCR umożliwia komputerową konwersję rastrowych plików graficznych zawierających teksty drukowane, pisane maszynowo i odręcznie na tekst możliwy do przetwarzania w edytorach tekstu. OLR pozwala na cyfrowe wydzielenie artykułów z zeskanowanej strony zawierającej więcej niż jeden artykuł. NER jest narzędziem służącym do wykrywania i klasyfikacji pojedynczych elementów tekstu w ramach określonych kategorii, takich jak nazwiska, nazwy organizacji, nazwy geograficzne i in.

W ramach projektu dokonana zostanie również ocena jakościowa zastosowanych technologii oczyszczania zdigitalizowanego tekstu oraz transformacja lokalnych formatów metadanych, które zostaną dostosowane do standardu Europeana Data Model (EDM) w ścisłej współpracy partnerów z sektora publicznego i prywatnego.

Koordynatorem projektu jest Biblioteka Państwowa w Berlinie.

Partnerzy projektu

  • Biblioteka Państwowa w Berlinie (koordynator projektu)
  • Biblioteka Narodowa Holandii
  • Biblioteka Narodowa Estonii
  • Biblioteka Narodowa Austrii
  • Biblioteka Narodowa Finlandii
  • Biblioteka Państwowa i Uniwersytecka w Hamburgu
  • Biblioteka Narodowa Francji
  • Biblioteka Narodowa Polski
  • Uniwersytet w Salford
  • CCS Content Conversion Specialists GmbH
  • LIBER
  • Biblioteka Narodowa Łotwy
  • Biblioteka Narodowa Turcji
  • Biblioteka Uniwersytecka w Belgradzie
  • Uniwersytet w Innsbrucku
  • Dr. Friedrich Tessmann Library
  • The British Library
  • The European Library

O portalu Europeana

Europeana to wielojęzyczna wirtualna kolekcja, obejmująca miliony zdigitalizowanych obiektów z europejskich muzeów, bibliotek, archiwów i zbiorów audiowizualnych. Dziś Europeana umożliwia zintegrowany dostęp do ponad 23 milionów książek, filmów, obrazów, eksponatów muzealnych i archiwalnych dokumentów z ponad 2200 kolekcji w całej Europie. www.europeana.eu

UDOSTĘPNIJ:

Aktualności

Pan Herbert – podróżnik. Grudniowe oprowadzania kuratorskie

czytaj więcej o Pan Herbert – podróżnik. Grudniowe oprowadzania kuratorskie

Lista rankingowa Kierunku interwencji 1.1. Zakup i zdalny dostęp do nowości wydawniczych NPRCz 2.0 na lata 2021–2025 drugiego naboru zaakceptowana

czytaj więcej o Lista rankingowa Kierunku interwencji 1.1. Zakup i zdalny dostęp do nowości wydawniczych NPRCz 2.0 na lata 2021–2025 drugiego naboru zaakceptowana