Hiện nay, sau gần 40 năm kể từ khi tiến hành các hội nghị đầu tiên về chuẩn hoá chính tả, thuật ngữ, các nhà ngôn ngữ học nước nhà vẫn mải miết tranh cãi nhau trong việc chọn lựa một giải pháp tối ưu để xử lí vấn đề này. Và trong khi chờ đợi thì bản đồ vẫn cứ phải in, sách giáo khoa vẫn cứ phải xuất bản, các cơ quan truyền thông thì vẫn cứ phải làm việc,… và giao diện phần mềm, tài liệu hướng dẫn sử dụng thì vẫn cứ phải Việt hoá.
Cuộc sống vốn đa dạng. Ngôn ngữ cũng đa dạng và các giải pháp xử lí tên riêng nước ngoài cũng rất đa dạng. Tên riêng nước ngoài, như một phần tất yếu của cuộc sống, đi vào tiếng Việt với nhiều chiều hướng, cách thức khác nhau và tạo thành một “phổ” với năm “gam màu” chủ đạo (theo GS. Hoàng Thị Châu). Nếu đi từ cực Việt hoá triệt để đến cực nguyên dạng thì có thể hình dung “phổ” đó như sau:
- Dịch nghĩa (translation)
- Dịch nghĩa toàn bộ và trực tiếp: Biển Đen, Biển Đỏ, Bờ Biển Ngà,…
- Dịch nghĩa toàn bộ và gián tiếp qua tiếng Hán: Địa Trung Hải, Thái Bình Dương, Cựu Thế Giới,…
- Dịch nghĩa bộ phận: Tân Ghinê, Đông Timo,…
- Phiên âm (transcription): gián tiếp qua tiếng Hán và trực tiếp
- Phiên âm gián tiếp toàn tên: Ấn Độ, Phần Lan, Tây Ban Nha, Nhật Bản,…
- Phiên âm gián tiếp giản lược tên: các nước Anh, Pháp, Mỹ, Nga,… các châu Úc, Phi, Á, Âu,…
- Phiên âm trực tiếp: Italia, Ôxtrâylia, Viên, Pari,…
- Chuyển tự (transliteration)
- Latin hoá (Latinization hay Romanization): Peking/Beijing, Bāgdhād, Irāq, Yahamoto,…
- Từ các bộ chữ Latin khác nhau ra chữ quốc ngữ: Moskwa → Moskva, Warzsawa → Warzsava,…
- Phiên chuyển (phiên âm + chuyển tự): Afghanistan → Apganixtan,…
- Nguyên dạng: Gambia, Namibia, Mali,…
Với một thực trạng như thế, hết cơ quan này đến đơn vị khác xây dựng đề tài và các nhà ngôn ngữ lại lao vào nghiên cứu, nghiệm thu và rồi “em vẫn hiền ngoan như thế”…
Trong khi kì cạch với đống .po thì thằng lngt đụng phải hai món tên ngôn ngữ và tên vùng lãnh thổ. Sau khi xem xét lại đối tượng sử dụng phần mềm, hắn cho rằng nên đi theo hướng nguyên dạng hoặc Latin hoá. Đó cũng là quan điểm mà UNGEGN khuyến cáo. Cụ thể trong trường hợp này là:
- Hạn chế tối đa những trường hợp phiên âm trực tiếp hoặc phiên chuyển và đưa chúng về nguyên dạng hoặc Latin hoá. Ví dụ: Ôtxtrâylia, Matxcơva,…
- Những trường hợp đã được Việt hoá ở mức cao (dịch nghĩa, phiên âm qua Hán Việt) thì nên giữ lại. Ví dụ: Anh, Pháp, Hà Lan, Tây Ban Nha,…
Đây cũng là vấn đề cần xử lí trong tập tin `vi.xml’ của CLDR.
Nói chung, để mà xử lí nội dung nằm giữa hai cặp thẻ <languages></languages>
và <territories></territories>
cho gọi là tương đối ổn thoả thì còn phải tốn cả chục lít nước bọt nữa.