Dự án của Hội
Từ điển nhật dụng thường đàm

Từ điểnNhật dụng thường đàm  của Phạm Đình Hổ (1768-1839), là bộ tự điển song ngữ Hán -Việt nhỏ, giải thích chữ Hán bằng chữ Nôm, xếp theo 32 môn loại như: Thiên văn, Luân tự, Nho giáo, Đạo giáo, Thích giáo, Thân thể, Thất ốc, Tác dụng, Thực phẩm, Quả thưởng, Đại dụng, Trướng dụng,  Du hí, Tật bệnh, Cầm thú, Trùng loại v.v... Các từ ngữ tuy không nhiều, nhưng có thể nói là tạm đủ để đọc biết các chữ thông thường. Đó cũng là một tài liệu mà chúng ta có thể dùng so sánh để thấy những chỗ khác biệt trong cách chua và giải nghĩa chữ Hán bằng chữ Nôm.

Từ điển song ngữ Nhật dụng thường đàm hiện đang lưu giữ tại Thư viện Quốc gia Việt Nam, mang kí hiệu R.1726, được khắc in năm Tự Đức thứ 4 (1851), do nhà in Đồng Văn Trai tàng bản. Ngoài trang bìa và bài tựa, sách gồm 52 tờ khắc in trên dấy dó. Nội dung được chia làm 32 môn loại, mỗi môn loại chia thành nhiều mục từ khác nhau; mỗi mục từ được chia làm 2 phần là chữ Hán và giải thích nghĩa bằng chữ Nôm:天 Thiên: 羅𡗶 là trời; Nhật 日: 羅𩈘𡗶  là mặt trời.

Nằm trong kế hoạch mục tiêu của Hội Bảo tồn Di sản chữ Nôm, chúng tôi tiếp tục thực hiện số hoá hoàn toàn quyển từ điển Nhật Dụng Thường Đàm dựa trên kết quả “Dự án số hoá thư tịch cổ văn hiến Hán Nôm” giữa Thư viện Quốc gia Việt Nam và Hội Bảo tồn Di sản chữ Nôm. Tài liệu số (mã số số hoá : nlvnpf-0693 ; mã số thư viện : R.1726) này hy vọng là một công cụ hữu ích đối với học sinh, sinh viên Hán Nôm, ngôn ngữ nói chung và các ngành khoa học xã hội nhân văn nói riêng. Đặc biệt là đối với những người đang bắt đầu học Hán Nôm.


Từ Điển Taberd

Dictionarium Anamitico Latinum (Từ điển Taberd) được xuất bản lần đầu tiên vào năm 1838 tại nhà in của J.Marshnam ở Serampore Ấn Độ. Và lần tái bản gần đây nhất năm 2004, do Trung tâm nghiên cứu Quốc học và Nhà xuất bản Văn học hợp tác xuất bản. Đây là cuốn từ điển cổ, quý hiếm ghi lại chữ Nôm, tiếng Việt cách ngày nay khoảng 200 năm, điều đặc biệt là do một Giám mục người Pháp AJ.L Taberd biên soạn. Từ điền Taberd có một vị trí và giá trị to lớn trong việc tìm hiểu, nghiên cứu, bảo tồn kho tàng tiếng Việt, chữ Nôm, đặt biệt trong đó có nhiều từ ngữ cổ mà ngày nay tiếng Việt không còn sử dụng nữa. Do vậy, việc tái hiện, số hoá xây dựng thành tài liệu điện tử theo nguyên bản là rất cần thiết, nhằm lưu trữ, bảo tồn, quảng bá rộng rãi.

Từ điển Taberd trực tuyến được xây dựng dựa theo bản in lại năm 2004, với phương pháp số hoá ở dạng ảnh, mục đích nhằm tái hiện nguyên bản. Có thể nói đây là một công cụ tra cứu rất hữu ích đối với những người nghiên cứu khoa học xã hội nhân văn nói chung và những người nghiên cứu ngôn ngữ văn tự đặc biệt là chữ Nôm nói riêng. Từ điển Taberd được thực hiện với mục đích tra cứu trực tuyến theo nguyên bản dạng ảnh. Ngoài phần dẫn nhập và chỉ dẫn, chúng tôi tập trung xây dựng công cụ tra cứu cho hai mục chính:

  • Phần tra theo bộ thủ
  • Phần tra theo âm quốc ngữ

Tác Phẩm Chinh Phụ Ngâm

Hội Bảo tồn Di sản chữ Nôm số hoá và xin đưa ra một phiên bản từ kết quả “Dự án số hoá thư tịch cổ văn hiến Hán Nôm” giữa Thư viện Quốc gia Việt Nam và Hội Bảo tồn Di sản chữ Nôm (mã số số hoá : nlvnpf-0064 ; mã số thư viện : R.1560).

Chinh phụ ngâm (征婦吟, khúc ngâm của người chinh phụ), còn có tên khác là Chinh phụ ngâm khúc (征婦吟曲) là tác phẩm văn vần của Đặng Trần Côn, ra đời trong khoảng năm 1741 giai đoạn sơ kỳ Cảnh Hưng và về sau được nhiều người dịch ra thơ Nôm.


Tác phẩm Lục Vân Tiên

Hội Bảo tồn Di sản chữ Nôm số hoá và xin đưa ra một phiên bản từ kết quả “Dự án số hoá thư tịch cổ văn hiến Hán Nôm” giữa Thư viện Quốc gia Việt Nam và Hội Bảo tồn Di sản chữ Nôm (mã số số hoá : nlvnpf-0059 ; mã số thư viện : R.403).

Trong truyện Lục Vân Tiên, Nguyễn Đình Chiểu đã dựng lên cả một xã hội trong đó những nhân vật chính diện tiêu biểu là Lục Vân Tiên và Kiều Nguyệt Nga đã tượng trưng cho tài năng, trí tuệ, nhân phẩm của con người. Đó là những con người học rộng, tài cao. Tuy mỗi người mỗi vẻ, mỗi nét mặt khác nhau, nhưng họ đều là những người "cương trực", "khẳng khái", "vị tha" và “trọng nghĩa hiệp". Họ sẵn sàng cứu giúp người khác không sợ khó khăn nguy hiểm và nêu cao cái nghĩa khí “giữa đường gặp sự bất bình chẳng tha". Họ kiên trì đứng về lẽ phải mà suy nghĩ và hành động. Những đặc tính cao đẹp đó cững chính là những đức tính cơ bản của con người Việt Nam nói chung và của nhân dân Nam Bộ nói riêng. Những đặc tính đó đã hình thành và củng cố trên trường kỳ lịch sử nhất là trong quá trình dân tộc ta khai phá và mở mang mảnh đất miền Nam của Tổ quốc, cho nên nó đặc biệt thể hiện rõ nét ở nhân dân Nam Bộ. Những đặc tính đó không những đã được phản ánh trong văn học dân gian mà còn được khẳng định trong sử sách.


Thư viện gia phả cho các dòng họ

Dự án xây dựng hệ thống lưu giữ thông tin gia phả các dòng họ Việt Nam trên internet là một dự án của Hội bảo tồn di sản chữ Nôm nhằm khuyến khích việc đưa vào lưu trữ dạng điện tử các thông tin chữ Nôm có trong gia phả của nhiều gia đình và dòng họ.

  • Xây dựng kho dữ liệu ảnh của các cuốn gia phả viết trong chữ Hán Nôm
  • Thiết kế kiến trúc hệ thống lưu trữ và tìm kiếm gia phả trên mạng
  • Chuyển ngữ và kết nối thông tin cho các gia phả
  • Phục chế và in ấn các cuốn gia phả theo yêu cầu

Xuất bản sách Hán Nôm
  • Từ điển “Giúp đọc Nôm và Hán Việt” của Trần Văn Kiệm
  • Kỷ yếu hội nghị quốc tế về chữ Nôm 2004 và 2006
  • Kho chữ Hán Nôm mã hoá

Tập thơ Hồ Xuân Hương

Hồ Xuân Hương được mệnh danh là bà chúa thơ Nôm, những bài thơ của bà đã chiếm được lòng của đông đảo độc giả và các tầng lớp trong xã hội. Giáo sư John Balaban đã dịch các bài thơ nổi tiếng của bà ra tiếng Anh trong đó có nguyên gốc chữ Nôm và Quốc ngữ và công trình của Giáo sư được đưa lên mạng dạng điện tử để độc giả dễ dàng tìm hiểu.


Các hoạt động tại IRG

Tham gia công tác với IRG từ năm 2006 đến nay (Cơ quan quốc tế có trách nhiệm về các chữ biểu ý 1 năm học 2 lần) làm việc trên các tập kí tự chữ biểu ý, được chia thành các mặt phẳng mã Unicode gồm:

  • BMP & Extension A ( Việt Nam có 5069 chữ);
  • Extension B ( Việt Nam có 4232 chữ);
  • Extension C ( Việt Nam có 784 chữ);
  • Extension D & E ( Việt Nam có 1327 chữ).

Dựa trên các mặt phảng mã mà IRG trong đó có Việt Nam (VNPF) kiểm  tra chuẩn hoá chữ, đồng nhất chữ,… để đưa vào kho mã Unicode.


Thư viện số sách Hán Nôm

Thư viện Quốc gia Việt Nam tại Hà Nội hiện đang bảo tồn và lưu giữ một bộ sưu tập đặc biệt gồm hơn 4000 thư tịch Hán Nôm, đây là hệ thống viết tiếng Việt thời xưa. Kể từ năm 2006, Thư viện Quốc gia Việt Nam đã hợp tác với Hội Bảo tồn Di sản chữ Nôm để bảo tồn và phát huy di sản văn hóa quan trọng này qua việc xây dựng một thư viện số. Những gì độc giả nhìn thấy qua hình ảnh và dữ liệu hiển thị trên mạng máy tính này là những bước đầu của sự thành lập thư viện số, nhằm giúp cho việc nghiên cứu của các học giả, độc giả, và giới học thuật trong nước cũng như nước ngoài tiếp cận. Mục tiêu của sự hợp tác này là để cung cấp một thư viện số dễ dùng cho toàn bộ sưu tập về Hán Nôm của Thư viện Quốc gia Việt Nam qua sự sử dụng kỹ thuật hiện đại về số hoá, khoa học thư viện và thông tin. Đây là thư viện số đầu tiên áp dụng cho các văn tự cổ này. Rất nhiều bản văn này chưa từng được ra mắt thế giới vì tích chất đặc biệt của loại thư tịch này.

Thư viện số được phân loại thành 4 mục chính gồm

  • Kinh điển có 369 cuốn sách
  • Lịch sử có 156 cuốn
  • Triết học có 324 cuốn
  • Văn học có 399 cuốn

Kho chữ Hán Nôm mã hoá

Kho chữ này được biên soạn để giới thiệu chung về các chữ Hán Nôm đã được mã hoá trên máy tính. Kho chữ này là tập hợp các nỗ lực của nhiều chuyên gia Hán Nôm và công nghệ thông tin đã tiến hành trong hơn 15 năm qua nhằm đưa chữ Nôm vào Bộ ký tự mã hoá quốc tế Unicode và các chuẩn mã hoá ký tự chữ Việt.

Các chữ Nôm đã qua tuyển chọn và gán mã đều được đưa vào tài liệu này để giới thiệu cho những người làm chuyên môn về Hán Nôm học và người làm công nghệ thông tin sử dụng. Người sử dụng có thể dùng kho chữ này để tìm hiểu các nguyên tắc xây dựng kho chữ Hán Nôm của Việt Nam và của thế giới (nguyên tắc của Nhóm Báo cáo viên chữ Biểu ý (Ideographic Rapporteur Group, IRG) của Tổ chức Tiêu chuẩn Quốc tế (International Standards Organization, ISO).

Người sử dụng cũng có thể dùng kho chữ này làm bảng tra cứu, đối chiếu giữa

  • Các bộ của chữ Hán Nôm;
  • Mã Unicode và chữ Nôm;
  • Chữ Nôm và các âm đọc Quốc ngữ;
  • Âm đọc chữ Quốc ngữ và các tự dạng chữ Nôm tương ứng.

Năm phiên bản truyện Kiều

Truyện Kiều của Nguyễn Du là một tác phẩm lớn và tiêu biểu của nền văn học Việt Nam, và Nguyễn Du là một danh nhân văn hoá thế giới. Hiện nay chưa có một văn bản nào xác nhận là nguyên bản truyện Kiều. Hội đã số hoá 5 phiên bản để đọc giả tiếp cận và tìm hiểu về tác giả và tác phẩm:

  • Truyện Kiều bản 1866 của Nguyễn Quảng Tuân phiên âm và khảo dị
  • Truyện Kiều bản 1870 của Nguyễn Quảng Tuân phiên âm và khảo dị
  • Truyện Kiều bản 1871 của Nguyễn Quảng Tuân phiên âm và khảo dị
  • Truyện Kiều bản 1872 của GS Nguyễn Tài Cẩn phiên âm và khảo dị
  • Truyện Kiều bản 1902 của Nguyễn Thế và Phan Anh Dũng phiên âm và khảo dị

Đại việt sử kí toàn thư

Số hoá cuốn sách ghi lại lịch sử Việt Nam từ thời “Hồng Bàng Thị” năm 1278-256 (Trước Công Nguyên) đến thời nhà Lê 1697 (sau Công Nguyên). Đưa lên mạng theo danh mục và dòng lịch sử để bạn đọc có thể tra cứu lịch sử Việt Nam dạng sách điện tử (với nguyên bản chữ Hán Nôm, phần chữ Hán Nôm và phiên âm, phần dịch nghĩa, tra cứu).


Giúp đọc Nôm và Hán Việt
  • Lần đầu tiên sử dụng bộ phông Hán Nôm theo chuẩn quốc tế để làm chế bản và in cuốn sách “Giúp đọc Nôm và Hán Việt” của Trần Văn Kiệm.
  • Đưa “Giúp đọc Nôm và Hán Việt” lên mạng để tra cứu dạng từ điển điện tử

Trang web của VNPF
  • Cập nhật liên tục các dự án của hội
  • Đưa thông tin các hoạt động của hội
  • Phục vụ bạn đọc trong việc bảo tồn và phát huy các giá trị chữ Nôm và hội đang thực hiện

Công cụ tra cứu Nôm

Xây dựng công cụ hữu ích tra cứu Nôm dựa trên cơ sở dữ liệu 38,773 mục từ. Cho phép người dùng có thể tra cứu theo:

  • Theo âm quốc ngữ
  • Theo tự dạng Hán Nôm
  • Theo mã Unicode
  • Theo tiếng Anh
  • Theo âm: Bắc Kinh, Quảng Đông
  • Theo bộ thủ và số nét

Phông Hán Nôm và cơ sở dữ liệu quản lí phông
  • Đã xây dựng được bộ phông Hán Nôm dạng true type đến nay đã có 22,922 chữ được cập nhật thường xuyên. Khởi dựng và hoàn thành phiên bản đầu tiên năm 2004 có 17,000 chữ.
  • Cơ sở dữ liệu quản lí bộ phông 22,922 chữ và 38,773 mục từ với cấu trúc:
    • Mã unicode
    • Tự dạng Nôm
    • Dạng biến thể
    • Âm quốc ngữ
    • Mẫu ghép
    • Thành tố 1 âm đọc
    • Thành tố 1 mã unicode
    • Thành tố 1 tự dạng
    • Thành tố 2 âm đọc
    • Thành tố 2 mã unicode
    • Thành tố 2 tự dạng
    • Bộ thủ
    • Mã bộ thủ
    • Số nét
    • Ngữ cảnh
    • Tiếng Anh
    • Phiên âm Bắc Kinh
    • Âm Quảng Đông
    • Mã Khang Hy