Câu hỏi:
05/11/2024 504Trong bảng mã Unicode tiếng Việt, mỗi kí tự được biểu diễn bởi bao nhiêu byte?
A. 1 byte
B. 2 byte
C. 3 byte
Trả lời:
Đáp án đúng là ; D
- Trong bảng mã Unicode tiếng Việt, mỗi kí tự được biểu diễn bởi từ 1 đến 3 byte.
Bảng mã ASCII mã hoá kí tự La tinh không dấu: 1 byte, sử dụng 2 byte để mã hoá các nguyên âm có dấu, các kí tự đ Đ và chỉ dùng 3 byte để mã hoá một số rất ít các kí tự đặc biệt.
→ D đúng.A,B,C sai.
* Bảng mã ASCII
- Trong máy tính mỗi kí tự được biểu diễn bằng một dãy bit, dãy bit được gọi là mã nhị phân.
- ASCII là bộ mã chuẩn của Mỹ để trao đổi thông tin. Mã ASCII của một kí tự là dãy 7 bit, có thể biểu diễn 128 kí tự khác nhau và mở rộng mã ASCII bằng cách sử dụng mã nhị phân dài 8 bit, biểu diễn thêm được 128 kí tự nữa.
- Mã nhị phân của những kĩ tự đã có trong bảng mã ASCII được thêm bit 0 vào trước để đủ độ dài 8 bit. Các kĩ tự mới thêm đều có mã nhị phân bắt đầu với bit 1.
2. Bảng mã Unicode
- Bảng mã Unicode được thiết kế để thống nhất chung việc mã hóa các kí tự cho tất cả ngôn ngữ khác nhau trên thế giới.
- Chữ Nôm cổ của nước ra cũng có trong bảng mã, với chức năng như vậy, bảng mã Unicode được sử dụng ngày càng phổ biến.
3. Mã kí tự, bộ kí tự và mã nhị phân
Con đường đi từ kí từ cho đến mã nhị phân chia làm hai bước:
Bước thứ nhất: Cho tương ứng mỗi kí tự với một mã kí tự duy nhất, là một dãy kí số, giống như số căn cước công dân là mã định danh duy nhất của mỗi người.
Bước thứ hai: Chuyển từ mã kí tự thành dãy bit để máy tính xử lí được, gọi là mã hóa. Kết quả bước này là một dãy bit, đây là mã nhị phân của kí tự.
4. Dữ liệu văn bản và số hóa văn bản
- Trong bối cảnh phân biệt các loại dữ liệu trong máy tính thì dữ liệu văn bản được biểu diễn là văn bản chữ, không chứa hình ảnh, âm thanh.
Văn bản thuần chữ
- Văn bản thuần chữ (plain text), gồm các kí tự gõ nhập từ bàn phím khi soạn thảo văn bản, các kí tự xếp liên tiếp từ trái sang phải, từ trên xuống dưới.
- Mỗi kí tự là một dãy bit.
Dữ liệu văn bản
- Dữ liệu văn bản trong máy tính là một dãy bit biểu diễn các kí tự có kiểu dáng, màu sắc và các thông tin định dạng khác.
5. Kí tự tiếng Việt trong dữ liệu văn bản
- Hiện nay tiêu chuẩn Việt Nam đã thống nhất dùng bảng mã kí tự Unicode.
- Bộ gõ tiếng Việt Unikey khá phổ biến, hiện nay có công cụ dễ dàng chuyển đổi các văn bản theo tiêu chuẩn cũ sang dùng mà Unicode để phù hợp với tiêu chuẩn mới.
Xem thêm các bài viết liên quan,chi tiết khác:
Lý thuyết Tin học 10 Bài 3: Số hóa văn bản
Giải sách bài tập Tin học lớp 10 Bài 3: Thực hành sử dụng thiết bị số - Cánh diều
CÂU HỎI HOT CÙNG CHỦ ĐỀ
Câu 1:
Dựa trên bảng mã ASCII, Việt Nam xây dựng bảng mã VSCII (Vietnamese Standard Code for Information Interchange), còn gọi là TCVN 5712: 1993. Hãy tìm hiểu bảng mã này trên Internet theo những gợi ý sau:
- Bảng mã có đủ cho tất cả các kí tự tiếng Việt không?
- Bảng mã có bảo toàn bảng mã ASCII 7 bit không?
Dựa trên bảng mã ASCII, Việt Nam xây dựng bảng mã VSCII (Vietnamese Standard Code for Information Interchange), còn gọi là TCVN 5712: 1993. Hãy tìm hiểu bảng mã này trên Internet theo những gợi ý sau:
- Bảng mã có đủ cho tất cả các kí tự tiếng Việt không?
- Bảng mã có bảo toàn bảng mã ASCII 7 bit không?
Câu 2:
Có hai bộ gõ tiếng Việt rất thông dụng là Unikey và Vietkey. Nếu mở bảng điều khiển của hai phần mềm này ta sẽ thấy rất nhiều bảng mã tiếng Việt trong đó có TCVN3. Em hãy tìm hiểu trên Internet để biết bảng mã TCVN3 là gì.
Có hai bộ gõ tiếng Việt rất thông dụng là Unikey và Vietkey. Nếu mở bảng điều khiển của hai phần mềm này ta sẽ thấy rất nhiều bảng mã tiếng Việt trong đó có TCVN3. Em hãy tìm hiểu trên Internet để biết bảng mã TCVN3 là gì.
Câu 3:
Bảng kí tự La tin và bảng kí tự tiếng Việt
1. Bảng kí tự La tinh có những kí tự nào?
2. Trong tin học, mỗi nguyên âm có dấu thanh của tiếng Việt là 1 kí tự. Hãy kể tên các kí tự có trong tiếng Việt không có trong bảng kí tự La tinh. Có bao nhiêu kí tự như vây?
Bảng kí tự La tin và bảng kí tự tiếng Việt
1. Bảng kí tự La tinh có những kí tự nào?
2. Trong tin học, mỗi nguyên âm có dấu thanh của tiếng Việt là 1 kí tự. Hãy kể tên các kí tự có trong tiếng Việt không có trong bảng kí tự La tinh. Có bao nhiêu kí tự như vây?
Câu 4:
Mã nhị phân và mã thập phân của các kí tự S, G, K trong bảng mã ASCII là gì?
Mã nhị phân và mã thập phân của các kí tự S, G, K trong bảng mã ASCII là gì?
Câu 5:
Câu trả lời nào đúng cho câu hỏi “Tại sao cần có Unicode?”
A. Để đảm bảo bình đẳng cho mọi quốc gia trong ứng dụng tin học.
B. Bảng mã ASCII mã hoá mỗi kí tự bởi 1 byte. Giá thành thiết bị lưu trữ ngày càng rẻ nên không cần phải sử dụng các bộ kí tự mã hoá bởi 1 byte
C. Dùng một bảng mã chung cho mọi quốc gia) giải quyết vấn đề thiếu vị trí cho bộ kí tự của một số quốc gia) đáp ứng nhu cầu dùng nhiều ngôn ngữ đồng thời trong cùng một ứng dụng.
D. Dùng cho các quốc gia sử dụng chữ tượng hình.
Câu trả lời nào đúng cho câu hỏi “Tại sao cần có Unicode?”
A. Để đảm bảo bình đẳng cho mọi quốc gia trong ứng dụng tin học.
B. Bảng mã ASCII mã hoá mỗi kí tự bởi 1 byte. Giá thành thiết bị lưu trữ ngày càng rẻ nên không cần phải sử dụng các bộ kí tự mã hoá bởi 1 byte
C. Dùng một bảng mã chung cho mọi quốc gia) giải quyết vấn đề thiếu vị trí cho bộ kí tự của một số quốc gia) đáp ứng nhu cầu dùng nhiều ngôn ngữ đồng thời trong cùng một ứng dụng.
D. Dùng cho các quốc gia sử dụng chữ tượng hình.
Câu 7:
Kiểu số thực thường dùng để biểu diễn các số có phần thập phân (phần lẻ). Em hãy cho ví dụ một loại hồ sơ có dữ liệu kiểu số thực.
Kiểu số thực thường dùng để biểu diễn các số có phần thập phân (phần lẻ). Em hãy cho ví dụ một loại hồ sơ có dữ liệu kiểu số thực.
Câu 8:
Thông tin đưa vào máy tính dưới dạng dãy bit. Như vậy khi đưa vào máy tính, phải mã hoá thông tin thành dữ liệu nhị phân. Tuỳ theo bản chất của thông tin được mã hoá mà dữ liệu tương ứng có các cách biểu diễn riêng, từ đó hình thành nên các kiểu dữ liệu khác nhau. Vậy trong máy tính có các kiểu dữ liệu nào?
Thông tin đưa vào máy tính dưới dạng dãy bit. Như vậy khi đưa vào máy tính, phải mã hoá thông tin thành dữ liệu nhị phân. Tuỳ theo bản chất của thông tin được mã hoá mà dữ liệu tương ứng có các cách biểu diễn riêng, từ đó hình thành nên các kiểu dữ liệu khác nhau. Vậy trong máy tính có các kiểu dữ liệu nào?
Câu 9:
Phân loại thông tin
Hình 3.1 minh hoạ một thẻ căn cước công dân. Trên đó có những thông tin gì?
Hãy chia sẻ những thông tin đó thành các nhóm, ví dụ nhóm thông tin có thể tách ghép được hay so sánh được để tìm kiếm và nhóm các thông tin có thể thực hiện được với các phép tính số học.
Phân loại thông tin
Hình 3.1 minh hoạ một thẻ căn cước công dân. Trên đó có những thông tin gì?
Hãy chia sẻ những thông tin đó thành các nhóm, ví dụ nhóm thông tin có thể tách ghép được hay so sánh được để tìm kiếm và nhóm các thông tin có thể thực hiện được với các phép tính số học.
Câu 10:
Giấy chứng nhận sở hữu xe máy có các thông tin nêu ở cột bên trái của bảng sau. Hãy ghép mỗi thông tin ở cột bên trái với kiểu dữ liệu thích hợp ở cột bên phải
Giấy chứng nhận sở hữu xe máy có các thông tin nêu ở cột bên trái của bảng sau. Hãy ghép mỗi thông tin ở cột bên trái với kiểu dữ liệu thích hợp ở cột bên phải