Cào “Danh mục các ngôn ngữ” của Ethnologue

Trang Ethnologue Language Code Index liệt kê 7299 ngôn ngữ trên thế giới. Ngoài ra, cơ sở dữ liệu của Ethnologue còn có thông tin chi tiết về tất cả các họ, nhóm ngôn ngữ trên thế giới. Tuy nhiên, trước mắt chỉ cào 7299 ngôn ngữ kia thôi. #!/bin/sh # Cào “Danh mục các……

Tình trạng sử dụng với phong cách và năng lực

Liệu có thể lấy căn cứ chính là tình trạng sử dụng từ ngữ nước ngoài trong phát ngôn (bao gồm cả khi nói và viết; và ở mọi phong cách: Từ phong cách khoa học đến phong cách khẩu ngữ,…) để kết luận về phong cách (xét ở khía cạnh tâm lí học) và……

Bildoj k demandoj: Parto 1

“Bildoj kaj demandoj” là khoá học tiếng Esperanto theo phương pháp trực tiếp, dành cho người mới bắt đầu. “Phương pháp trực tiếp” nghĩa là: chỉ dùng ngôn ngữ mà bạn đang học trong toàn bộ khoá học (trong trường hợp này là Esperanto). Theo cách này, bạn sẽ sử dụng ngay ngôn ngữ và……

“Regex Spellcheck” for Vietnamese (continued)

“Regex Spellcheck” (step 2a) 😀 #! /bin/sh # Vietnamese-initial-sounds splitter # This script will split the Vietnamese syllables list (named 'LIST') # into initial-sound-based lists. Each list (stored in one *.txt file) # contains syllables that begin with one individual initial sound # (presented in Quốc ngữ writing system). # NOTICE: The initial sound /?-/……

“Regex Spellcheck” for Vietnamese

“Regex Spellcheck” (step 1) 😆 (ch|gh|kh|ngh|ng|nh|p|ph|th|tr|b|c|d|đ|g|h|gi|k|l|m|n|q|r|s|t|v|x)? ( ( [uo] )? ( ( [aàảãáạăằẳẵắặâầẩẫấậeèẻẽéẹêềểễếệiìỉĩíịoòỏõóọôồổỗốộơờởỡớợuùủũúụưừửữứựyỳỷỹýỵ] ) | ( y[aàảãáạêềểễếệ] ) ) | ( ia|ìa|ỉa|ĩa|ía|ịa|iê|iề|iể|iễ|iế|iệ|ưa|ừa|ửa|ữa|ứa|ựa|ươ|ườ|ưở|ưỡ|ướ|ượ|ua|ùa|ủa|ũa|úa|ụa ) ) ( (i|o|u|y|m|n|ng|nh|p|t|c|ch)? ) 😛