Tạo danh sách đối chiếu chính tả

#! /bin/sh

# Trường hợp CH - TR
#  Lấy 'LIST' (danh sách các âm tiết) ở đây: 
echo 'Đang tạo danh sách các âm tiết...'
egrep "^ch" LIST > ch.txt
egrep "^tr" LIST > ch.txt

echo 'Đang tạo danh sách tạm...'
sed -e 's/^ch//g' -e 's/$/_ /g' ch.txt > tmp.txt
sed -e 's/^tr//g' -e 's/$/__ /g' tr.txt >> tmp.txt

# Sắp xếp (sau khi đã cập nhật locale:  http://forum.vnoss.org/viewtopic.php?id=1948)
sort tmp.txt > CH-TR.txt

echo 'Tạo các cặp'
sed -r -e 's/^(.*)__ $/\\|tr\\1/g; s/^(.*)_ $/\\|ch\\1\\|/g' -i CH-TR.txt
sed -e :a -e '/$/N;s/\\n//g; ta' -i CH-TR.txt
sed -r -e 's/\\|ch/\\nch/g' -i CH-TR.txt
sed -r -e 's/\\|\\|/\\t/g; s/\|$/\\t/g; s/\\|tr/\\n\\ttr/g' -i CH-TR.txt
sed -e '/^$/d' -i CH-TR.txt

echo 'Removing temporary file'
rm -f tmp.txt

echo -e "\\nCẢNH BÁO:\\nDanh sách còn nhiều lỗi.\\nTrong phiên bản này, bạn phải chỉnh sửa thủ công.\\n"

#  TODO:
#  Tự động sửa lỗi cho các cặp không đúng. Có lẽ phải dùng Perl.