KHAI THÁC NGUỒN HỌC LIỆU MỞ TỪ CÁC THƯ VIỆN TRÊN THẾ GIỚI VỚI GIẢI PHÁP WORLDCAT DISCOVERY SERIVCES-OCLC
Trịnh Xuân Giang
Công ty IDT Vietnam
Trong những năm gần đây khi các bộ sưu tập tài liệu điện tử, tài liệu số ngày càng đóng vai trò quan trọng trong những bộ sưu tập tài liệu của thư viện đã khiến cho những cổng tra cứu OPAC truyền thống của trở nên gặp phải nhiều hạn chế trong việc tra cứu tài liệu, người dùng tin lúc này sẽ phải thông qua nhiều công đoạn khác nhau mới có thể tìm được một cách đầy đủ và toàn vẹn nhất đến nguồn tài liệu mà họ muốn. Nhìn nhận thấy điều này các nhà cung cấp giải pháp phần mềm thư viện đã xây dựng lên một số giải pháp với mục đích tiết kiệm thời gian tìm kiếm cho bạn đọc thư viện. Federated Search là một trong những giải pháp đầu tiên được xây dựng với khả năng tìm kiếm thông tin từ các cơ sở dữ liệu riêng biệt khác nhau trong kho dữ liệu của thư viện để sau đó trả về kết quả dưới một giao diện duy nhất. Giải pháp này đã thu được những thành công nhất định vào thời điểm bắt đầu được đưa ra thị trường nhưng vẫn còn một số hạn chế khi không hiển thị được một cách hoàn chỉnh được nội dung siêu dữ liệu từ các CSDL khác nhau. Điểm nổi bật nhất của Federated Search lúc này là đã chỉ ra được cho người dùng các CSDL khác nhau để phục vụ cho việc tìm kiếm.
Nhận thấy được tính năng Federated Search chưa thể hiện được rằng nó là một giải pháp thay thế toàn diện, lúc này các dịch vụ tìm kiếm và chuyển giao tài nguyên thông tin bắt đầu được xây dựng. Về cơ bản các hệ thống này được xây dựng xung quanh một hệ thống đánh chỉ mục tập trung duy nhất với nguồn dữ liệu gồm có là CSDL nội bộ của thư viện, những CSDL khác thư viện đang sử dụng. Các thao tác thực hiện kết quả tìm kiếm được thực hiện qua một hộp tìm kiếm đơn giản giống như Google, kết quả tìm kiếm sau đó sẽ được trả về trong một giao diện duy nhất. Trong những năm qua các hệ thống tìm kiếm thông tin tập trung đang trở nên rất phổ biến trong các trường đại học, nơi mà các hệ thống tìm kiếm tập trung được triển khai riêng biệt với các nhà cung cấp phần mềm quản lý thư viện. Hệ thống tìm kiếm tập trung đầu tiên xuất hiện trên thị trường là Worldcat Local OCLC được bắt đầu cung cấp vào năm 2007 và đến thời điểm này phiên bản cập nhật mới nhất của Worldcat Local trở thành Worldcat Discovery Services. Tiếp theo Worldcat Local của OCLC là hệ thống Summon do Proquest phát triển được cung cấp ra thị trường vào năm 2009, đến năm 2010 EBSCO xuất hiện trên thị trường giải pháp với sản phẩm EDS Discovery Services, mới phát triển nhất trên thị trường là hai hệ thống Encore Synergy do Innovative phát triển và Primo Central của Ex Li-bris Israel.
1.2. KHÁI NIỆM HỆ THỐNG TÌM KIẾM VÀ CHUYỂN GIAO TÀI NGUYÊN THÔNG TIN TẬP TRUNG(HTTKCGTNTT)
HTTKCGTNTT là một khái niệm mới ra đời khoảng giữa những năm 2000 và đã nhanh chóng được nhiều thư viện áp dụng, đặc biệt là các thư viện đại học. Triết lý của hệ thống này là lấy người dùng làm trung tâm của hệ thống. Tương tác người dùng đầu cuối “Front-End” của dịch vụ nhắm tới việc cung cấp thống nhất cách trình bày kết quả theo một định dạng chung, trên một giao diện web duy nhất cho dù các nguồn dữ liệu là khác nhau hay các định dạng khác nhau.
Theo hiệp hội thư viện Mỹ (American Library Association) thì HTTKCGTNTT là một công cụ đầy tiềm năng để biến đổi bản chất của hệ thống thư viện. Các dịch vụ này có khả năng tìm kiếm thông tin nhanh chóng từ nhiều nguồn khác nhau (trong và ngoài thư viện, nội bộ hay từ xa), tạo ra sự liền mạch và thống nhất trong việc cung cấp thông tin, thông tin được tìm kiếm trên một phạm vi rộng lớn, các kết quả tìm kiếm được xếp hạng và có gợi ý các tài liệu liên quan, và kết quả được trình bày trong một giao diện trực quan đúng như mong đợi của người tìm kiếm thông tin. Mỗi hệ thống sẽ bao gồm ba thành tố cơ bản: nội dung thông tin, giao diện trình bày và các chức năng liên quan đến tìm kiếm, thu thập và phân phối thông tin.
2. DỊCH VỤ TÌM KIẾM THÔNG TIN TẬP TRUNG WORLDCAT DISCOVERY
2.1. GIỚI THIỆU CHUNG VỀ HỆ THỐNG
Dịch vụ Worldcat Discovery Services do OCLC (Trung tâm Thư viện Máy tính Trực tuyến) cung cấp là một giải pháp tìm kiếm và chuyển giao tài nguyên thông tin tập trung, khả năng tìm kiếm và truy cập đến 2 tỷ điểm tài liệu của 74.000 thư viện trên thế giới và các nhà cung cấp nội dung trên thế giới. Worldcat Discovery là một ứng dụng điện toán đám mây (cloud-based application).Worldcat Discovery tạo ra một kênh liên lạc trực tiếp giữa người dùng thư viện với các dịch vụ, tài liệu của thư viện và các nhà nhà cung cấp nội dung chỉ bằng một cổng tìm kiếm thông tin duy nhất.
2.2. CẤU TRÚC CỦA WORLDCAT DISCOVERY
Ngoài dữ liệu của các nhà cung cấp nội dung danh tiếng trên thế giới hiện nay những nguồn dữ liệu mở (Open Access) cũng là một hướng phát triển đang được OCLC phát triển rất mạnh cho Worldcat Discovery. Khi các thư viện đăng ký sử dụng Worldcat Discovery thư viện mặc định sẽ có quyền truy cập vào tất cả các bộ cơ sở dữ liệu tài nguyên mở đang được tích hợp trong hệ thống chỉ mục tập trung của hệ thống mà thư viện.
3. CÁC THÀNH PHẦN CỦA HỆ THỐNG WORLDCAT DISCOVERY
3.1. HỆ THỐNG CHỈ MỤC TRUNG TÂM CỦA WORLDCAT DISCOVERY
Trái tim của những HTTKCGTNTT hiện nay là hệ thống đánh chỉ mục trung tâm. Hệ thống sẽ tiến hành đánh chỉ mục đối với toàn bộ nội dung như nội dung của thư viện cung cấp, nội dung thư viện mua của các nhà cung cấp nội dung nước ngoài, sau đó trả về kết quả dưới một giao diện duy nhất.
Được xây dựng và hoạt động dựa trên tiêu chí xuyên suốt đó là sự chia sẻ tài nguyên thông tin giữa các thư viện thành viên, hệ thống chỉ mục trung tâm của Worldcat Discovery Services ban đầu được xây dựng nên từ nền tảng là những tài nguyên thông tin do các thư viện là thành viên của OCLC đang đóng góp lên hệ thông mục lục liên hợp toàn cầu Worldcat. Dựa trên nền tảng của Worldcat nguồn dữ liệu trong hệ thống chỉ mục tập trung của Worldcat Discovery hiện cung cấp cho người sử dụng nguồn thông tin gồm có:
+ 324 triệu biểu ghi sách, bài trích và 2,2 tỷ điểm vốn tài liệu trên Worldcat
+ 40 triệu biểu ghi tài liệu lưu trữ
+ 22 triệu biểu ghi luận văn luận án
+ 21 triệu file âm thanh,
+ 17 triệu thông tin về biểu ghi sách điện tử
+ 13 triệu biểu ghi ấn phẩm nhiều kỳ
+ 5 triệu biểu ghi bản đồ
Sau khi đã xây dựng được hệ thống chỉ mục trung tâm dựa trên nền tảng của Worldcat, OCLC tiếp tục làm việc với các thư viện thành viên cùng những thư viện đang là người sử dụng các sản phẩm của OCLC trên toàn thế giới để xác định nhu cầu sử dụng CSDL của các thư viện, các thư viện có những đánh giá gì về các CSDL của các nhà cung cấp hiện đang có trên thị trường hiện nay để từ đó làm việc với các nhà cung cấp nội dung trên thị trường hiện nay để làm phong phú thêm nội dung trong hệ thống chỉ mục trung tâm của Worldcat Discovery. Hệ thống sẽ cung cấp cho người sử dụng khả năng truy cập vào thông tin tài liệu của trên 150 nhà cung cấp nội dung lớn trên thế giới đang là đối tác của OCLC như Springer, Elsevier, EBSCO, Proquest,… Worldcat Discovery Services hiện là hệ thống tìm kiếm thông tin tập trung duy nhất trên thế giới có thể truy cập được vào nội dung tài liệu của các nhà cung cấp EBSCO và Proquest hiện nay.
Nguồn dữ liệu mở trong Worldcat Discovery hiện nay đang được đóng góp từ các thư viện là thành viên của OCLC và các nhà cung cấp nội dung. Có thể kể tên các CSDL tiêu biểu như.
- OAIster: Là một cơ sở dữ liệu của tổ chức OCLC (Online Computer Library Center) cho phép tìm kiếm các nguồn thông tin học thuật điện tử miễn phí được đóng góp bởi các các nhân, tổ chức trên toàn thế giới. Hiện có trên 30 triệu thông tin về tài liệu có thể được tìm kiếm qua bộ máy của OAIster dưới các định dạng: văn bản, âm thành, hình ảnh,video. Các loại hình tài liệu như: luận văn, luận án, báo cáo nghiên cứu, tài liệu kỹ thuật, các bộ sưu tập hình ảnh
- HathiTrust: Là một dự án hợp tác chia sẻ các kho dữ liệu số từ các thư viện và viện nghiên cứu, trong đó có cả các tài liệu được số hóa thông qua từ các án liên quan tới Google Books. HathiTrust được thành lập vào tháng 12 năm 2008 với sự hợp tác của 60 thư viện, viện nghiên cứu từ Hoa Kỳ, Canada và Châu Âu. Tính đến tháng 10 năm 2015 HathiTrust chứa thông tin của hơn 13,5 triệu ấn phẩm bao phủ nhiều lĩnh vực khác nhau.
- Worldcat Dissertation and Theses: Bộ CSDL chứa thông tin về trên 20 triệu tài liệu luận văn, luận án do các thư viện thành viên OCLC đóng góp, trong số đó có rất nhiều các đường link tài liệu toàn văn. Worldcat Dissertation and Theses hiện đang được đánh giá là một trong những CSDL luận văn, luận án lớn trên thế giới hiện nay.
- Cộng đồng CONTENTdm:Các bộ sưu tập tài liệu số được chia sẻ trong cộng đồng 3.000 thư viện trên thế giới đang sử dụng phầm mềm quản lý bộ sưu tập số CONTENTdm do OCLC phát triển. Các tài liệu được chia sẻ thông qua cộng đồng thư viện CONTENTdm gồm các loại hình như luận văn, luận án, âm thanh, các bộ sưu tập hình ảnh,…
- ArticleFirst: Bộ CSDL về thông tin trích dẫn (citations) của hơn 16,000 tạp chí phát hành từ năm 1990 trong các lĩnh vực Khoa học công nghệ, Y học, Khoa học xã hội nhân văn, Văn hóa, Kinh tế. ArticleFirst chứa 27,000,000+ biểu ghi (records) cùng với danh sách các thư viện sở hữu hầu hết các đầu tạp chí trên, được cập nhật hàng ngày.
- Electronic Books – eBooks: Bộ CSDL toàn diện chứa các biểu ghi của những sách điện tử được biên mục bởi các thành viên OCLC. ElectronicBooks gồm hơn 1,900,000 biểu ghi của những ebooks được biên mục từ trước tới nay cùng tên các thư viện sở hữu chúng, được cập nhật hàng ngày.
- Electronic Collection Online (ECO): Bộ CSDL chỉ mục tới hơn 5000 tạp chí điện tử của OCLC. Người dùng có thể xem bản tóm tắt và các bài báo toàn văn từ các tạp chí mà thư viện đã đặt mua. ECO bao gồm hơn 4,200,000 biểu ghi của các tạp chí xuất bản từ năm 1995 đến nay và được cập nhật hàng ngày. Tạp chí trong ECO bao quát các chủ đề: Nông nghiệp, Nhân loại học, Kinh tế kinh doanh, Giáo dục, Mỹ thuât, Địa lý, Ngôn ngữ học, Luật, Khoa học thư viện, Văn học, Y học, Triết học, Khoa học chính trị, Tâm lý học, Tôn giáo, Khoa học xã hội, Công nghệ.
- MEDLINE: Bộ CSDL về lĩnh vực y khoa, kỹ thuật điều dưỡng, nha khoa, thú y, sinh học, hóa sinh học và tổ chức y tế… Được biên soạn bởi Trung tâm Thông tin Công nghệ sinh học quốc gia (NCBI) thuộc Thư viện Y khoa Quốc gia Hoa Kỳ (NLM) cho phép truy cập miễn phí trực tuyến. CSDL của MEDLINE chứa hơn 18,700,000 biểu ghi từ hơn 19,000 tài liệu xuất bản từ những năm 1950 đến nay và được cập nhật các trích dẫn bổ sung hàng ngày.
- ERIC: Bộ CSDL chỉ mục tới hơn 1000 tạp chí và các loại tài liệu khác về ngành giáo dục được phát hành bởi Bộ Giáo dục Hoa Kỳ. ERIC gồm hơn 1,400,000 biểu ghi thư mục của tài liệu từ hơn 1,000 tạp chí phát hành từ 1966 tới nay, được cập nhật hàng tháng. Các tài liệu trong ERIC bao quát các chủ đề: Giáo dục các cấp, hướng nghiệp và dạy nghề, đánh giá giáo dục, thông tin và công nghệ trong ngành giáo dục, môi trường giáo dục, đạo đức trong ngành, học sinh sinh viên và các vấn đề… ERIC chứa một phần tài liệu toàn văn cho phép truy cập mở.
Ngoài các bộ CSDL trên người dùng của Worldcat Discovery cũng sẽ được truy cập vào các CSDL truy cập mở từ các nhà cung cấp nội dung trên thế giới với các bộ CSDL như Wiley Online Library Open Access 2011 – 2015; World bank Policy Research Working paper; Taylor and Francis Open Access; ScienceDirect Journals - Cell Press; Oxford, Cambridge University press; Nature Publishing Group,…
Bên cạnh các bộ CSDL trên hệ thống chỉ mục tập trung của Worldcat Discovery bao gồm thông tin tài liệu từ 2000 cơ sở dữ liệu của các thư viện đang đóng góp vào hệ thống chỉ mục tập trung của Worldcat Discovery.
3.2. LỚP TRA CỨU VÀ KHAI THÁC THÔNG TIN TRONG WORLDCAT DISCOVERY
3.2.1. TÍNH NĂNG TRA CỨU THÔNG TIN
Worldcat Discovery hiện hỗ trợ hai tính năng là tìm kiếm cơ bản và tìm kiếm nâng cao. Với cả hai tính năng này chỉ một phép tìm kiếm duy nhất bạn đọc hay cán bộ thư viện có thể truy cập được vào tất cả các loại hình tài liệu dưới các định dạng khác nhau liên quan đến từ khóa tìm kiếm. Tính năng tìm kiếm cơ bản của Worldcat Discovery được hiển thị dưới một hộp tìm kiếm đơn giản tương tự như công cụ tìm kiếm Google.
(Giao diện tìm kiếm cơ bản trong Worldcat Discovery)
Về khả năng hỗ trợ tìm kiếm nâng cao Worldcat Discovery cung cấp 50 tùy chọn khác nhau cho người sử dụng để có thể lọc, mở rộng phạm vi tìm kiếm. Hệ thống hỗ trợ tìm kiếm với các toán tử “and, or, not” bên cạnh đó người sử dụng cũng có thể giới hạn phạm vi kết quả tìm kiếm theo năm hay theo loại hình tài liệu… Với khả năng tìm kiếm cơ bản Worldcat Discovery không giới hạn số lượng các CSDL thực hiện tìm kiếm trong một lần thực hiện, tuy nhiên với tính năng tìm kiếm nâng cao bạn đọc có thể giới hạn số lượng các CSDL nhất định để thực hiện thao tác tìm kiếm.
(Giao diện tra cứu nâng cao của Worldcat Discovery)
Trong quá trình thực hiện tìm kiếm Worldcat Discovery thực hiện tìm kiếm và đánh chỉ mục theo các trường dữ liệu cơ bản gồm có “Tiêu đề, tên tác giả, chủ đề, tên tạp chí, tên bộ sưu tập, loại hình tài liệu, ngôn ngữ, bình duyệt (Peer Review), phạm vi bộ sưu tập,…” sau khi thực hiện tìm kiếm, đánh chỉ mục với các trường dữ liệu trên nếu kết quả vẫn chưa thích hợp với từ khóa Worldcat Discovery sẽ thực hiện tìm kiếm, đánh chỉ mục tới các trường dữ liệu còn lại trong phần hiển thị thông tin siêu dữ liệu biểu ghi của tài liệu. Điều này làm cho Worldcat Discovery luôn trả về được kết quả tìm kiếm với các trường dữ liệu kể cả các trường dữ liệu được đánh chỉ mục yếu.
3.2.2. HIỂN THỊ VÀ KHAI THÁC THÔNG TIN.
Nếu thư viện là thành viên của OCLC và đóng góp các thông tin biểu ghi về vốn tài liệu của thư viện mình lên hệ thống mục lục Worldcat, khi các thư viện sử dụng Worldcat Discovery thư viện có thể yêu cầu tùy chỉnh thông tin để thông tin về biểu ghi của thư viện, thông tin về các điểm vốn tài liệu của thư viện đang ở trên Worldcat sẽ luôn được hiển thị đầu tiên trên trang kết quả tìm kiếm của Worldcat Discovery, danh sách này sẽ được hiển thị dưới dạng một bản danh mục từ A-Z. Sau khi hiển thị thông tin chi tiết về biểu ghi sẽ là vị trí của tài liệu và trạng thái hiện tại của tài liệu trong cơ sở dữ liệu OPAC của thư viện.
Để tạo thuận lợi cho bạn đọc trong quá trình nhận biết tài liệu và định dạng của tài liệu. Hệ thống sẽ chỉ ra với các định dạng tài liệu khác nhau sẽ luôn có các thông báo riêng về biểu tượng của tài liệu được đặt ngay dưới tiêu đề như e-book, audio book, e-audio book, DVD video, videocassette, music, CD audio, cassette, audio book, musical score, computer file, journal /magazine/newspaper, Internet resource.
(Giao diện hiển thị thông tin chung)
Với tài liệu số nội sinh của thư viện, hay tài liệu thư viện mua của các nhà cung cấp nội dung, hay các tài liệu từ các nguồn dữ liệu mở hệ thống sẽ tự động rà soát các tài liệu nào cần phải xác thực truy cập, tài liệu nào hiện đang được cho phép truy cập toàn văn và hiển thị đến bạn đọc thông qua tính năng “View Online”.
Worldcat Discovery sẽ xếp hạng mức độ liên quan trong kết quả tìm để đưa các kết quả có nội dung gần nhất đối với yêu cầu tìm kiếm thông qua việc xếp hạng thông tin các kết quả tìm cũng như gợi ý các tài liệu liên quan đến yêu cầu của người tìm. Ví dụ người dùng tìm tài liệu tên là Marketing được xuất bản năm 2013 thì kết quả sẽ hiển thị các tài liệu liên quan đến lĩnh vực Marketing của tác giả đấy trong các năm trước hoặc sau đó như 2012 hoặc 2014.
(Giao diện hiển thị tài liệu điện tử cho phép truy cập trực tuyến)
Tích hợp dịch vụ mượn liên thư viện: Với Worldcat Discovery thư viện có thể được tích hợp trực tiếp dịch vụ mượn liên thư viện toàn cầu (Worldshare Interlibrary Loan) do OCLC cung cấp hiện đang được sử dụng trên 9.000 thư viện trên thế giới. Dịch vụ sẽ được tích hợp trực tiếp trên giao diện của hệ thống, bạn đọc sau khi tìm kiếm tài liệu có thể tra cứu xem tài liệu có thể được mượn liên thư viện không, sau đó sẽ sử dụng dịch vụ mượn liên thư viện để mượn tài liệu của thư viện khác theo nhu cầu của mình.
Tích hợp tính năng mượn liên thư viện
Worldcat Discovery cung cấp khả năng lọc và hiển thị kết quả tìm kiếm theo dạng facets trực tiếp trên màn hình sử dụng. Các thông tin về yếu tố miêu tả của các biểu ghi tài liệu, nội dung tài liệu được chia nhỏ và hiển thị trực tiếp trên màn hình hiển thị trang kết quả tìm kiếm sẽ giúp bạn đọc nhanh chóng thu gọn được phạm vi tìm kiếm tài liệu theo nhu cầu sử dụng. Các bộ lọc theo dạng Facets được hiển thị theo các trường dữ liệu trong biểu ghi tài liệu.
Bộ lọc kết quả được hiển thị trực tiếp trên màn hình(phần bôi đỏ)
Không như các cổng OPAC thông thường Worldcat Discovery cung cấp một giao diện hỗ trợ cho các thiết bị di động, thiết bị thông minh, người sử dụng có thể thông qua các thiết bị thông minh truy cập đến thông tin tài liệu của thư viện với một phép tìm kiếm đơn nhất.
4. KẾT LUẬN
Với sự gia tăng không ngừng của vốn tài liệu thuộc các loại hình khác nhau hiện nay cùng với xu thế khai thác thông tin trực tuyến và sử dụng tài nguyên số đang đặt các thư viện vào một bài toán đó là làm thế nào để có thể giải quyết được nhu cầu thông tin của bạn đọc sử dụng thư viện một cách nhanh chóng nhất và thuận tiện nhất. Trong bối cảnh các công cụ khai thác và tra cứu thông tin trong các phần mềm quản lý thư viện thế hệ trước chưa bắt kịp được với xu thế phát triển hiện đại, các giải pháp tìm kiếm và chuyển giao tài nguyên thông tin tập trung xuất hiện trên thị trường và đã đáp ứng được nhu cầu sử dụng của các thư viện. Trong số các giải pháp hiện nay đang có trên thị trường thế giới dịch vụ Worldcat Discovery Services do OCLC phát triển với những ưu thế mạnh mẽ về sự kết hợp và chia sẻ tài nguyên trong một cộng đồng thư viện lớn nhất thế giới là một giải pháp đáng để cho các thư viện Việt Nam tham khảo trong quá trình hội nhập với cộng đồng thư viện toàn cầu.
TÀI LIỆU THAM KHẢO
- CHRISTISON, Andrew (2013) Discovery layers and discovery services. ISSN 0008 – 7629
- Wang H, Andrew (2015) Worldcat discovery. Presentation
- Đỗ Văn Hùng, Web scale discovery – giải pháp tìm kiếm và khai thác thông tin trong kỷ nguyên số
http://flis.edu.vn/web-scale-discovery-giai-phap-tim-kiem-va-khai-thac-thong-tin-cho-cac-thu-vien-trong-ky-nguyen-internet/1652
- Hathitrust: https://www.hathitrust.org/about
- Trần Lê, Những khái niệm cơ bản liên quan tới tài nguyên giáo dục mở
http://vnfoss.blogspot.com/2012/10/nhung-khai-niem-co-ban-lien-quan-toi.html
- The OAIster project: http://www.lib.umich.edu/digital-library-production-service-dlps/oaister/
- OAIster: https://www.oclc.org/support/services/oaister/OAIster.en.html
- Worldcat Discovery Services http://www.oclc.org/enasiapacific/worldcat-discovery/resources.html