Tổng quan về Dữ liệu bản địa

Xem báo cáo CLDR 1.3: Overview and What’s New thấy mấy cái đáng lưu ý:

  1. Dữ liệu bản địa là gì?
  2. Các kiểu Dữ liệu bản địa
  3. Các nguyên nhân của sự không thống nhất dữ liệu
  4. Các thách thức

Chép lại để lúc nào đó rỗi hơi sẽ đọc kĩ hơn :P.

What is Locale Data?

  • Locale = identifier referring to linguistic and cultural preferences
    • en_US, en_GB, ja_JP
  • Locale doesn’t refer to data like in POSIX
  • These preferences can change over time due to cultural and political reasons
    • Introduction of new currencies, like the Euro
    • Standard sorting of Spanish changes
  • Many of these preferences have varying degrees of standardization
    • 12 and 24 hour format in the United States
  • This is a very broad topic
  • Scope of data limited to common system applications

Types of Locale Data

  • Dates/time formats
  • Number/Currency formats
  • Measurement System
  • Collation Specification
    • Sorting
    • Searching
    • Matching
  • Translated names for language, territory, script, timezones, currencies,…
  • Script and characters used by a language

Causes of Conflicting Data

  • Typographical errors
    • Canda instead of Canada
  • Regional differences
    • German spelling is different between countries
  • Context of usage
    • Normal German sorting versus German phonebook sorting
  • Parts of speech
    • “март 2004” versus “3 марта” when the Russian word for March is used in a date
  • Standards versus common use
    • “Republic of Laos” versus “Laos”
  • Misunderstanding
    • Translating year format “yyyy” as “jjjj” instead of changing localized pattern characters
  • Uncommon cases
    • Translating the “Interlingua” language name into other languages
  • Individual preferences
    • 24 hour time format versus 12 hour time format

Challenges

  • Complex Formats
  • Experts knowledgeable both in technology and a specific language
    • Collation
    • Exemplar characters
    • Etc…
  • Require close interaction of CLDR experts with language experts

Không biết giới chuyên môn trong nước có quan tâm nhiều đến vấn đề này không nhỉ? Ai sẽ có trách nhiệm đề xuất chuẩn? Ai sẽ có trách nhiệm ban hành chuẩn? Ràng buộc pháp lí sẽ ở mức nào?



Một bình luận cho “Tổng quan về Dữ liệu bản địa”

  1. Nhà nước ta còn bận lo công ăn việc làm cho dân. Không ai dư hơi để ý ba cái tào lao trên Internet.
    Mà chừng nào đọc kỹ, nhớ tóm tắt lại, công bố để tui coi ké nhe 🙂

Bình luận

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.