Mong ước thầm kín

Hôm nay thằng ku Hùng mua xương về nấu. Khà khà, ngon phết!

Trong lúc ăn, thằng ku phàn nàn là miếng xương khó gặm rồi thắc mắc:
— Tại sao chó nó lại gặm xương dễ thế nhỉ?
— Nhưng nó cũng không cầm bát đũa được.
— Ước gì mình khi gặm xương thì giống chó, lúc còn lại thì là người…
— 😮 , 😆 [Cơm bắn ra đằng mũi]

“Regex Spellcheck” for Vietnamese (continued)

“Regex Spellcheck” (step 2a) 😀

#! /bin/sh

# Vietnamese-initial-sounds splitter

# This script will split the Vietnamese syllables list (named 'LIST')
# into initial-sound-based lists. Each list (stored in one *.txt file)
# contains syllables that begin with one individual initial sound
# (presented in Quốc ngữ writing system).
# NOTICE: The initial sound /?-/ is not included here
# 
# If you haven't got 'LIST', you can get it from TuDienVan package:
# http://sf.net/project/showfiles.php?group_id=134457&package_id=151085
#

# All lists will be moved into this directory
tmpdir=c1a
# List of initial sounds
sounds='ch gh kh ngh ng nh p ph th tr b c d đ g h gi k l m n q r s t v x'

# Checking for Vietnamese syllables list
if [ ! -f LIST ]; then 
	echo 'Fatal error: LIST not found!';
	echo 'Please correct this problem before perform any actions!';
	exit
fi

# Create target directory if not existed
if [ ! -d $tmpdir ]; then
	mkdir $tmpdir
fi

# Splitting...
for i in $sounds; do
	egrep "^$i" LIST > $tmpdir/$i.txt;
done

# Enter target directory and rename đ.txt to dd.txt
cd $tmpdir
mv -f đ.txt dd.txt

# OK, now stripping...
sed -r -e '/^ch/d' -i c.txt
sed -r -e '/^g[hi]/d' -i g.txt
sed -r -e '/^kh/d' -i k.txt
sed -r -e '/^n[gh]/d' -i n.txt
sed -r -e '/^ngh/d' -i ng.txt
sed -r -e '/^ph/d' -i p.txt
sed -r -e '/^t[hr]/d' -i t.txt

# Counting...
wc -l *.txt | tail -n 1

“Regex Spellcheck” for Vietnamese

“Regex Spellcheck” (step 1) 😆

(ch|gh|kh|ngh|ng|nh|p|ph|th|tr|b|c|d|đ|g|h|gi|k|l|m|n|q|r|s|t|v|x)?
(
 	(
 		[uo]
 	)?
 	(
 		(
 			[aàảãáạăằẳẵắặâầẩẫấậeèẻẽéẹêềểễếệiìỉĩíịoòỏõóọôồổỗốộơờởỡớợuùủũúụưừửữứựyỳỷỹýỵ]
 		)
 		|
 		(
 			y[aàảãáạêềểễếệ]
 		)
 	)
	|
	(
	ia|ìa|ỉa|ĩa|ía|ịa|iê|iề|iể|iễ|iế|iệ|ưa|ừa|ửa|ữa|ứa|ựa|ươ|ườ|ưở|ưỡ|ướ|ượ|ua|ùa|ủa|ũa|úa|ụa
	)
)
(
	(i|o|u|y|m|n|ng|nh|p|t|c|ch)?
)

😛

Trình chọn tập tin GTK

Trình chọn tập tin của GTK (hình như từ bản 2.6), theo mặc định, chẳng thấy chỗ nào để gõ đường dẫn rồi dùng phím Tab. Toàn phải dùng chuột bấm bấm, bực cả mình!

Thấy mình chửi nhiều quá, lão Bi tức cú khoe luôn chiêu Ctrl+L. Hehe, ngon phết.

Nhưng xét đi xét lại, và ngoảnh sang KDE thì… thì GTK file selector vẫn thuộc loại hâm :mrgreen:

VietNamNet dùng kí tự tổ hợp

Những chỗ nào mà phải document.write bằng JavaScript là mấy bác coder chơi luôn demical. Cái này cũng phải thôi, vì IE5 nó hiển thị sai nếu dùng kí tự bình thường. Nhưng oái oăm ở chỗ là các bác lại dùng dạng tổ hợp. Ví dụ: Trang nhấtTrang nhất. Rõ là rỗi hơi! Sao không là Trang nhất cho rồi. Vừa dài dòng lại không được các trình duyệt Gecko hỗ trợ. Trông lem nhem, chẳng muốn đọc…