[Nháp] Dự án ngữ liệu bằng ảnh

0. Mục đích Ghi nhận những minh chứng về sự tồn tại của những biến thể ngôn ngữ. Nói đơn giản là đã có lúc người ta viết như thế. Phát hiện những điều lí thú, bất thường trong đời sống ngôn ngữ nói riêng và đời sống xã hội nói chung. Tập hợp, phân… Continue reading [Nháp] Dự án ngữ liệu bằng ảnh

ISO 3166-1-vi

Hôm nay Clytie Siddall gửi iso_3166-1.8.vi.po lên translationproject.org. Có hai vấn đề: 1. Cách ghi tên riêng nước ngoài; 2. Cách gọi tên các dạng chính phủ và thể chế chính trị. Vấn đề thứ nhất là một cuốn tiểu thuyết dài kì, không có hồi kết. Còn vấn đề thứ hai thì không quá… Continue reading ISO 3166-1-vi

Bản tin số 4: words-vi-0.1

Vào hồi 23:57:53 ngày 21/11/2007, anh Nguyễn Thái Ngọc Bi, à Duy, (tên thường gọi là Bi cờ lao) đã ra thông báo phát hành words-vi-0.1. Giới thạo tin cho hay, để hoàn thành công trình quá cỡ quốc gia (mon men cỡ ASEAN và đang có ý định đạt đẳng cấp quốc tế) này,… Continue reading Bản tin số 4: words-vi-0.1

Ơ, bách khoa toàn thư này

Cái trang bachkhoatoanthu.gov.vn hoá ra cũng có từ điển trực tuyến. Buồn cho mình lạc hậu :-(. Vì là bách khoa toàn thư nên có nhiều lĩnh vực, riêng lĩnh vực ngôn ngữ học có 813 mục từ. A lê, cào thôi! for i in `seq 1 9`; do wget http://dictionary.bachkhoatoanthu.gov.vn/default.aspx?param=10D0Z3JvdXBpZD0yMiZraW5kPSZrZXl3b3JkPQ==\&page="$i" -O index-"$i".html; done grep… Continue reading Ơ, bách khoa toàn thư này

L10n :: Một số nguyên tắc/lưu ý khi dịch, viết

Những vấn đề dưới đây mới ở dạng ý tưởng, chưa toàn diện và chắc là còn nhiều áp đặt, thiếu sót,... Bác nào quan tâm thì cho vài xu. 1. Vấn đề I/Y Xem chi tiết... 2. Vị trí đặt dấu thanh điệu Đặt dấu thanh điệu trên nguyên âm chính. Ví dụ: toà,… Continue reading L10n :: Một số nguyên tắc/lưu ý khi dịch, viết

Những cái tít “lừa đảo”

Thỉnh thoảng lại gặp những cái tít mở rộng (hoặc thu hẹp) phạm vi sự kiện, đối tượng so với nội dung phản ánh trong bài. Ví dụ về trường hợp mở rộng: Trên VNN, ngày 26/6/2007, có cái tít nghe rất khủng: "Google doạ huỷ dịch vụ Gmail" (thực chất là chỉ doạ với… Continue reading Những cái tít “lừa đảo”

Sắp xếp danh sách trong tiếng Việt bằng PHP

Thú thực với các bác là cả đời mình, em chưa bao giờ nghiên cứu một thuật toán nào về sắp xếp cả (vì một thằng khối C như em thì chỉ nghe đến "thuật toán" là đã hãi rồi). Bình thường thì, khi có nhu cầu sắp xếp, em dùng sort. Cứ echo input… Continue reading Sắp xếp danh sách trong tiếng Việt bằng PHP