0. Mục đích Ghi nhận những minh chứng về sự tồn tại của những biến thể ngôn ngữ. Nói đơn giản là đã có lúc người ta viết như thế. Phát hiện những điều lí thú, bất thường trong đời sống ngôn ngữ nói riêng và đời sống xã hội nói chung. Tập hợp, phân… Continue reading [Nháp] Dự án ngữ liệu bằng ảnh
Ngôn ngữ
Ngôn ngữ học, tiếng Việt,… đại loại thế
Những nhân tố gia tăng sự méo mó của tiếng Việt
Thái độ ngôn ngữ tự ti, sính ngoại, đua đòi vô lối; Chính sách ngôn ngữ không rõ ràng, lỏng lẻo, mang tính đại khái, thiếu trách nhiệm, thiếu cơ sở khoa học và thực tiễn; Giáo dục ngôn ngữ yếu kém từ nội dung đến đội ngũ giảng dạy; ... (đang nghĩ tiếp)
ISO 3166-1-vi
Hôm nay Clytie Siddall gửi iso_3166-1.8.vi.po lên translationproject.org. Có hai vấn đề: 1. Cách ghi tên riêng nước ngoài; 2. Cách gọi tên các dạng chính phủ và thể chế chính trị. Vấn đề thứ nhất là một cuốn tiểu thuyết dài kì, không có hồi kết. Còn vấn đề thứ hai thì không quá… Continue reading ISO 3166-1-vi
Từ Gu-gờ đến ngonngu.net
Nằm trong kế hoạch cho ngonngu.net biết tí mùi MySQL, đồng thời để thoả mãn trí tò mò, tối qua em ngứa tay làm một cái bảng theo dõi người dùng. Nghe có vẻ "dữ dằn", nhưng thực ra cũng chả có gì ngoài mấy thông tin cơ bản. Đại loại cái bảng nó là… Continue reading Từ Gu-gờ đến ngonngu.net
Em đi học cấp 5
17h43'. Thầy em lên lớp muộn gần 15 phút. Thầy em lại hì hục 15 phút nữa với cái máy tính xách tay ghẻ đầy vi-rút, bao gồm các công đoạn: khởi động máy, tìm bài giảng, mở bài giảng, kéo đến phần đang học dở. Thế là đã gần 18h. Thầy em bắt đầu… Continue reading Em đi học cấp 5
Bản tin số 4: words-vi-0.1
Vào hồi 23:57:53 ngày 21/11/2007, anh Nguyễn Thái Ngọc Bi, à Duy, (tên thường gọi là Bi cờ lao) đã ra thông báo phát hành words-vi-0.1. Giới thạo tin cho hay, để hoàn thành công trình quá cỡ quốc gia (mon men cỡ ASEAN và đang có ý định đạt đẳng cấp quốc tế) này,… Continue reading Bản tin số 4: words-vi-0.1
Phát hiện không mới
Hoá ra, ngay từ năm 1945, sau khi giành độc lập, nước mình đã có chương trình đào tạo IT, mà đấy còn là chủ trương của chính phủ hẳn hoi. Ông nào không tin thì cứ xem phim tài liệu "75 năm Đảng Cộng sản Việt Nam".
Ơ, bách khoa toàn thư này
Cái trang bachkhoatoanthu.gov.vn hoá ra cũng có từ điển trực tuyến. Buồn cho mình lạc hậu :-(. Vì là bách khoa toàn thư nên có nhiều lĩnh vực, riêng lĩnh vực ngôn ngữ học có 813 mục từ. A lê, cào thôi! for i in `seq 1 9`; do wget http://dictionary.bachkhoatoanthu.gov.vn/default.aspx?param=10D0Z3JvdXBpZD0yMiZraW5kPSZrZXl3b3JkPQ==\&page="$i" -O index-"$i".html; done grep… Continue reading Ơ, bách khoa toàn thư này
L10n :: Một số nguyên tắc/lưu ý khi dịch, viết
Những vấn đề dưới đây mới ở dạng ý tưởng, chưa toàn diện và chắc là còn nhiều áp đặt, thiếu sót,... Bác nào quan tâm thì cho vài xu. 1. Vấn đề I/Y Xem chi tiết... 2. Vị trí đặt dấu thanh điệu Đặt dấu thanh điệu trên nguyên âm chính. Ví dụ: toà,… Continue reading L10n :: Một số nguyên tắc/lưu ý khi dịch, viết
Những cái tít “lừa đảo”
Thỉnh thoảng lại gặp những cái tít mở rộng (hoặc thu hẹp) phạm vi sự kiện, đối tượng so với nội dung phản ánh trong bài. Ví dụ về trường hợp mở rộng: Trên VNN, ngày 26/6/2007, có cái tít nghe rất khủng: "Google doạ huỷ dịch vụ Gmail" (thực chất là chỉ doạ với… Continue reading Những cái tít “lừa đảo”
Sắp xếp danh sách trong tiếng Việt bằng PHP
Thú thực với các bác là cả đời mình, em chưa bao giờ nghiên cứu một thuật toán nào về sắp xếp cả (vì một thằng khối C như em thì chỉ nghe đến "thuật toán" là đã hãi rồi). Bình thường thì, khi có nhu cầu sắp xếp, em dùng sort. Cứ echo input… Continue reading Sắp xếp danh sách trong tiếng Việt bằng PHP