Bài 3. Một số kiểu dữ liệu và dữ liệu văn bản

Một số kiểu dữ liệu và dữ liệu văn bản trang 8 sách bài tập Tin Học lớp 10 – NXB Kết Nối Tri Thức Với Cuộc Sống, mời các em tham khảo cùng Bumbii.

Chủ đề 1. Máy tính và xã hội tri thức. Bài 3. Một số kiểu dữ liệu và dữ liệu văn bản.

Câu 3.1

Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí nào?

A. Cách mã hoá.

B. Cùng chung các phép xử lí dữ liệu cơ bản.

C. Cả A và B đều đúng.

D. Cả A và B đều sai.

Đáp án: B.

Về cơ bản theo phép toán xử lí dữ liệu. Dữ liệu được mã hóa thống nhất để có thể xây dựng các phép xử lí trên cơ sở mã hóa. Việc mã hóa có mục đích thống nhất và tạo thuận lợi cho xử lí.

Câu 3.2

Kể ra 10 tên dữ liệu có trong học bạ có các kiểu văn bản, hình ảnh, số nguyên và số thập phân.

Đáp án: Một số ví dụ dữ liệu trong học bạ và kiểu của chúng:

– Kiểu văn bản: họ và tên, địa chỉ, tên trường.

– Kiểu số nguyên: ngày, tháng, năm sinh.

– Kiểu số có phần lẻ (phần thập phân): điểm trung bình môn.

– Kiểu ảnh: ảnh học sinh, dấu của trường, chữ kí của giáo viên.

Câu 3.3

Ngày nay mã QR (QR code) được sử dụng rất rộng rãi. Đây là mã hoá của xâu kí tự, có thể giải mã được bằng các ứng dụng đọc QR code, tải từ “chợ ứng dụng” xuống điện thoại thông minh. Ví dụ Hình 3.1 là mã QR của chuỗi kí tự http://en.m.wikipedia.org. Kiểu dữ liệu của QR code thuộc loại gì? hình ảnh hay xâu kí tự?

mã QR, kiểu dữ liệu văn bản — Hình 3.1. Mã QR

Đáp án: Kiểu dữ liệu của QR code thuộc loại hình ảnh, nó được xử lí ban đầu với vai trò là hình ảnh, từ đó mới ra xâu kí tự.

Câu 3.4

Em hãy tìm mã nhị phân và mã thập phân (số thứ tự của kí tự trong bảng mã ASCII) của các kí tự trong từ Computer.

Đáp án:

Biểu diễn của xâu kí tự “Computer” trong bảng mã ASCII mở rộng:

01000011 01101111 01101101 01110101 01110100 01100101 01110010

Câu 3.5

(*) Tìm hiểu 32 kí tự đầu tiên của bảng mã ASCII theo những gợi ý sau:

– Chúng được sử dụng với mục đích gì?

– Các kí tự đó có “mặt chữ” không? Hình ảnh trong ô là các kí tự Latinh (ví dụ EOT, CR,…) có phải là “mặt chữ” không?

Đáp án:

Trong bảng mã ASCII, 32 kí tự đầu tiên là các mã điều khiển. Chúng không được gán mặt chữ. Chúng có tên riêng theo chức năng của mình.

Ví dụ số 10 LF (line feet) sẽ chuyển con trỏ văn bản xuống dòng mới, còn kí tự số 13 CR (cariage return) sẽ đưa con trỏ về đầu dòng. Khi soạn thảo văn bản mà ta nhấn phím <Enter> thì phần mềm soạn thảo sẽ tự động chèn cả 2 kí tự này vào văn bản mà chúng ta không nhìn thấy vì chúng không có ảnh. Kết quả là khi nhấn Enter em thấy con trỏ văn bản chuyển về đầu dòng mới.

Nếu dùng mã điều khiển để làm mã kí tự thì phải gán mặt chữ cho nó. Ví dụ bộ mã tiếng Việt TCVN/5712:1993, còn gọi là bộ mã VSCII. Tuy nhiên việc lạm dụng có thể gây những hiệu ứng sai lệch. Ví dụ mã số 2 là STX (Start of Text) là mã báo bắt đầu truyền từ chữ tiếp theo cho đến khi gặp mã số 4 EOT (End of Text) thì ngừng truyền. Trong bảng mã VSCII dùng mã số 2 cho “Ụ”, còn mã số 4 cho “Ừ”, nên nếu truyền đi một dòng chữ có 2 kí tự Việt này, một số phần mềm sẽ hiểu sai.

Câu 3.6

Với 134 kí tự riêng phát sinh so với bảng chữ cái tiếng Anh, hoàn toàn có khả năng sắp xếp trong bảng chữ 8 bit với 256 kí tự. Theo em, tại sao Việt Nam vẫn cần sử dụng bảng mã Unicode?

Đáp án: Sử dụng bảng mã Unicode vì:

– Phải lấy thêm chỗ ở vùng mã điều khiển, có thể gây ra các bất cập như ví dụ ở câu 3.5.

– Thống nhất kí tự Việt trong tổng thể các kí tự chung của toàn thế giới, đặc biệt chúng ta luôn có nhu cầu sử dụng nhiều ngôn ngữ trong cùng một ứng dụng.

Câu 3.7

Unicode mã hoá mỗi kí tự bởi

A. 1 byte.

B. 2 byte.

C. 4 byte.

D. Từ 1 đến 4 byte.

Đáp án: D. Riêng trong tiếng Việt, với UTF-8 sẽ dùng từ 1 đến 3 byte để mã hóa cho một kí tự.

Câu 3.8

Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?

Đáp án:

Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tồn tại trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩ là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần.

Vì thế cần có một cách mã hóa đồng thời Unicode và một số bảng mã khác, đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ.

UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).

__________***__________

Xem các bài giải khác tại https://bumbii.com/giai-sach-bai-tap-tin-hoc-lop-10-nxb-ket-noi-tri-thuc-voi-cuoc-song/

Thông tin liên hệ & mạng xã hội:
Website: https://bumbii.com/
Facebook: https://www.facebook.com/bumbiiapp
Pinterest: https://www.pinterest.com/bumbiitech