Thứ Hai, 15 tháng 4, 2013

Các thẻ Meta trong HTML

Thẻlà một thành phần quan trọng trong file HTML, nó chứa các thông tin về file HTML đó như tên tác giả, các từ khoá, các thông tin mô tả site đó,… Và có thể có 1 số thông tin điều khiển trình duyệt, chỉ định cho các máy tìm kiếm, …

Thẻ Meta có có cấu trúc như sau:

HTTP-EQUIV=”" CONTENT=”" SCHEME=”" >

Trong đó NAME là tên của thẻ Meta, còn CONTENT là giá trị tương ứng với NAME đó, nội dung trong CONTENT chỉ có thể là Text chứ ko thể có các thẻ HTML trong đó.
SCHEME là định dạng của giá trị, ví dụ SCHEME=”Day-Month-Year” là định dạng ngày tháng năm
Không có chuẩn cho những thuộc tính của trong thẻ meta vì vậy bạn có thể tự định nghĩa thoải mái những metadata mà bạn thích. Ví dụ bạn có thể định nghĩa thông tin tác giả:
<META NAME=author CONTENT="Tac gia">
Một vài những bộ máy tìm kiếm như Google, sử dụng các meta keywords, description để  dựa vào đó để tìm kiếm thông tin

<meta name=”description” content=”VietNam PHP Blog, Việt Nam PHP Blog” />
<meta name=”keywords” content=”php, phpvn, phpvietnam, php vietnam, php vn, phpvn.info, vietphp, phpviet” />

Để tránh bị cắt cụt bởi máy tìm kiếm thì thông tin mô tả (description) nên nhỏ hơn 200 kí tự, từ khoá (keyword) được viết  cách nhau bởi dấu phẩy, và không phân biệt hoa thường, nếu có quá 2 từ khoá trong thẻ meta thì 1 vài máy tìm kiếm sẽ không lưu trang của bạn lại. Các bộ máy tìm kiếm hầu như chỉ làm việc với 1000 kí tự đầu tiên trong thẻ meta keyword.
Một vài bộ máy tìm kiếm còn sử dụng thẻ meta robots để xem trang mà nó vào có được phép lưu lại hoặc đi tiếp các link khác trong site hay không.
Giá trị của thẻ robots như sau:
- index: bộ máy tìm kiếm sẽ lưu trang này lại để giành cho việc tìm kiếm
- noindex: bộ máy tìm kiêm sẽ không nên lưu trang này
- follow: bộ máy tìm kiếm sẽ đi tiếp các Link trong trang này
- nofollow: bộ máy tìm kiếm sẽ không đi tiếp các Link trong trang này
- all tức là bao gồm index, follow
- none tức là noindex, nofollow
Ví dụ như sau: bạn muốn các bộ máy tìm kiếm ko lưu trang của bạn nhưng vẫn đi tiếp các link trong trang như sau:

<META NAME=robots CONTENT=”noindex,follow”>
Thuộc tính HTTP-EQUIV dùng để thay thế thuộc tính NAME trong 1 số trường hợp ví dụ:
<META HTTP-EQUIV=Expires CONTENT=”Thu, 29 Nov 2008 16:18:42 GMT”>
Thiết lập thời gian tồn tại của trang đó tới thời điểm nào
<META HTTP-EQUIV=”Content-Script-Type” CONTENT=”text/javascript”>
<META HTTP-EQUIV=”Content-Style-Type” CONTENT=”text/css”>
<META HTTP-EQUIV=”Content-Type” CONTENT=”text/html; charset=Shift_JIS”>
<META HTTP-EQUIV=Refresh CONTENT=”10; URL=http://www.htmlhelp.com/”>
Tự động refesh trang đó sau 10s, ko phải tất cả các trình duyệt đều hỗ trợ thẻ meta này.

Nhiều bộ máy tìm kiếm theo từ khoá chỉ sử dụng các thông tin trong thẻ meta để tìm kiếm dựa trên những từ khoá đã được viết sẵn trong thẻ keyword mà không tìm kiếm trong toàn từ ngữ trong site và kém hiệu quả hơn những bộ máy tìm kiếm toàn bộ những từ khoá trong site. Những bộ máy tìm kiếm toàn bộ site sẽ sử dụng các thông tin metadata để đánh thứ hạng tìm kiếm cho site.

Thông tin thêm các bạn có thể xem ở đây:

http://www.w3.org/TR/html4/struct/global.html#edef-META

http://www.w3.org/TR/REC-html32#meta

 

0 nhận xét:

Đăng nhận xét