Các tập tin Office như .docx (Word), .xlsx (Excel), .pptx (PowerPoint) kết thúc bằng “x” đều là các tệp XML được nén lại. Bạn có thể đổi đuôi của chúng thành .zip và giải nén để trích xuất hình ảnh chất lượng cao.
Mình đã chuẩn bị 1 tập tin có tên “file-sample_1MB.zip”; đây là bản sao từ tập tin “file-sample_1MB.docx” và đã đổi .docx thành .zip.
Mở tập tin “file-sample_1MB.zip” bằng WinRAR.
Tiếp tục đi vào trong thư mục “word”, bạn sẽ thấy được điều thú vị.
- Thư mục “media” chứa các hình ảnh, video.
- Thư mục “charts” chứa các biểu đồ.
- Tập tin “document.xml” chứa nội dung văn bản.
Các tập tin còn lại như style.xml, settings.xml, numbering.xml, fontTable.xml, các bạn tự tìm hiểu thêm nhé! Thực ra, vai trò của chúng đã được thể hiện rõ trên tên tập tin rồi.
Trên đây là một ví dụ sử dụng tập tin .docx, bạn cũng có thể làm điều tương tự trên các tập tin .xlsx và .pptx.
Cảm ơn bạn đã dành thời gian đọc bài viết ngắn này!