Semalt: Hiểu sơ đồ tri thức của Google và cách hoạt động



Để tạo điều kiện cho Google hiểu nội dung web của bạn, điều quan trọng là chúng tôi phải hiểu cách ảnh hưởng đến các chủ đề trong sơ đồ tri thức. Semalt là một trang web chuyên cung cấp các dịch vụ tốt nhất cho khách hàng của cô ấy, có nghĩa là hiểu mọi thứ liên quan đến SEO. Là một công ty tập trung vào cả thiết kế web và phát triển web, chúng tôi kết hợp SEO vào mọi khía cạnh của trang web. Tất nhiên, điều này bao gồm sự hiểu biết về Sơ đồ tri thức của Google.

Điều gì làm cho đồ thị kiến ​​thức trở nên đặc biệt?

Nếu không có biểu đồ tri thức, sẽ rất khó để công cụ tìm kiếm, đặc biệt là Google, sử dụng dữ liệu có cấu trúc cho các thực thể. Đổi lại, đánh dấu và dữ liệu ngữ nghĩa, giúp kết nối các ý tưởng và khái niệm, giúp chuyển đổi chúng thành dữ liệu có cấu trúc dễ dàng hơn mà chúng ta có thể sử dụng để lấp đầy hoặc tác động đến biểu đồ tri thức của Google.

Là các chuyên gia SEO, nhiệm vụ của chúng tôi là phải hiểu những cách chúng tôi có thể ảnh hưởng đến các chủ đề này trong biểu đồ, vì vậy chúng tôi có thể tác động đến những thay đổi có ý nghĩa trong sự hiểu biết của Google về nội dung của họ.

Là chuyên gia SEO, chúng tôi hiểu cách tác động đến các chủ đề trong biểu đồ để tác động đến những thay đổi có ý nghĩa trong sự hiểu biết của Google về nội dung của khách hàng của chúng tôi.

Sơ đồ tri thức của Google là gì?

Chúng tôi coi đồ thị tri thức là giao điểm giữa cơ sở dữ liệu và bách khoa toàn thư. Các nhà phát triển tham khảo từng bài viết trong biểu đồ tri thức dưới dạng Thực thể theo hoặc Chủ đề trong các bài viết hướng tới khách hàng của Google.

Một thực thể có thể là hoàn toàn bất cứ điều gì. Giống như với hầu hết các cơ sở dữ liệu, nó có số nhận dạng duy nhất mà đôi khi bạn thấy trong các URL của Google. Tuy nhiên, nó trông giống như sau: [kgmid=/ g/11f0vfyswk & hl], tên tham số "kgmid" có thể thay đổi tùy thuộc vào loại thực thể.

Thông thường, có nhiều câu lệnh về một thực thể:
  • Một tiêu đề hoặc tên (như "George Bush").
  • Loại hoặc Các loại (như "người").
  • Mô tả (như "đã từng là Tổng thống Hoa Kỳ").
  • Danh sách các URL hình ảnh (thường được liên kết với quyền sử dụng).
  • Mô tả chi tiết (một số văn bản giải thích có URL của nguồn).
Tuy nhiên, Google tuyên bố rằng mặc dù thông tin trong danh sách trên có thể có sẵn trực tiếp trong API tìm kiếm của họ, nhưng dữ liệu này được tăng cường đáng kể trong nội bộ.

Vì vậy, trong ví dụ trên, dữ liệu cũng có thể bao gồm ngày Bush sinh và mất; nó có thể bao gồm việc ông đã kết hôn với Barbara Bush. Nó có thể đề cập đến một số thành tích của anh ấy trong văn phòng, v.v.

Với tất cả các thông tin được cung cấp, sẽ dễ dàng hơn để thấy rằng không có nhiều sự khác biệt như thế nào khi so sánh với một bài báo bách khoa toàn thư. Tuy nhiên, sự khác biệt là bởi vì tất cả các dữ kiện được phân loại thành các trường như "Số năm tại vị", máy móc thấy việc kết nối các dấu chấm giữa các chủ đề dễ dàng hơn. Máy móc cũng dễ dàng truy xuất thông tin phù hợp hơn gần như ngay lập tức khi một người đưa ra yêu cầu. Ví dụ, nếu bạn tìm kiếm ai đã kết hôn với George Bush? Bạn nên xem thứ này:


Không rõ ràng

Có rất nhiều biểu đồ tri thức trên khắp thế giới và biểu đồ tri thức của Google chỉ là một trong số rất nhiều biểu đồ này. Các biểu đồ kiến ​​thức khác bao gồm Wikidata.org, dbpedia.com, v.v. Thật vậy, bất kỳ dạng dữ liệu nào có cấu trúc bán cấu trúc đều có thể được mô tả như một biểu đồ tri thức, đó là lý do tại sao các cơ sở dữ liệu như IMDB hoặc bách khoa toàn thư được gọi là đồ thị tri thức.

Ban đầu, Google xây dựng biểu đồ kiến ​​thức của mình từ các bộ dữ liệu khác, bao gồm CIA Factbook và Wikipedia. Chúng tôi cũng đã nghe tin đồn rằng bảng tri thức của Google cũng có thể hoạt động như biểu đồ tri thức của nó. Tuy nhiên, điều này không chính xác và cần được bỏ qua. Trong khi bảng tri thức đôi khi đại diện cho một tập hợp con dữ liệu trong biểu đồ, chúng không giống nhau.

Bảng tri thức cũng có thể hoạt động như một bản trình bày trực quan của các mục dữ liệu được kết nối thông qua biểu đồ tri thức của Google. Tuy nhiên, biểu đồ kiến ​​thức của Google là một bản ghi ít trực quan hơn về các chủ đề.

Điểm cuối cùng mà chúng tôi tìm cách phân biệt là bản thân thuật ngữ. Nói chung, biểu đồ kiến ​​thức từ khóa được tạo bằng các thực thể hoặc chủ đề. Để rõ ràng, chúng tôi nhận thấy rằng Google thích sử dụng thuật ngữ "chủ đề" hơn vì đó là thuật ngữ họ sử dụng liên tục trong tài liệu công khai của mình.

Chủ đề có xu hướng thân thiện với người dùng hơn, nhưng nó cũng gây khó hiểu khi Google đề cập đến các chủ đề hoặc thực thể.

Các loại chủ đề thực thể

Nói chung, các thực thể được cung cấp các loại chủ đề. Đây có thể là một người; Biến cố; Tổ chức, địa điểm hoặc quốc gia. Nếu thực thể không phải là bất kỳ một trong số này, nó được gắn nhãn là "Thứ". Hy vọng rằng Google sẽ tiếp tục phát triển các loại mục nhập mới để chúng ta sẽ ít sử dụng "Things" hơn. API xử lý ngôn ngữ tự nhiên được Google sử dụng cung cấp các manh mối quan trọng khiến chúng tôi tự hỏi liệu nhiều loại chủ đề có thực sự đang được sử dụng hay không. Tuy nhiên, có một số loại thực thể khác được tìm thấy trên trang dành cho nhà phát triển API tìm kiếm Sơ đồ tri thức của Google. Hiện tại, Google dường như không có khả năng phân loại nhiều thực thể như đã liệt kê. Chúng tôi hy vọng rằng điều này sẽ thay đổi theo thời gian.

Bên cạnh đó, chỉ có khoảng 20% ​​thực thể được nhận dạng bởi Thuật toán xử lý ngôn ngữ tự nhiên được Google sử dụng khi so sánh với đợt chào bán công khai của họ.

Lợi ích của Sơ đồ tri thức

Bằng cách sắp xếp thông tin của thế giới thành các chủ đề, việc thu thập thông tin và lập chỉ mục các trang web cũng như các trang web mà công cụ tìm kiếm tận dụng trở nên dễ dàng hơn. Chúng bao gồm tính đa dạng, quy mô, tính toàn vẹn và tốc độ.

Mở rộng lợi ích

Số lượng các trang web trên Internet là một chủ đề gây tranh cãi nhiều. Trong khi một số người có thể tranh luận rằng chúng là vô số, số lượng trang web rất có thể rơi vào hàng nghìn tỷ và con số này tiếp tục mở rộng với tốc độ khổng lồ hàng ngày. Ngược lại, số lượng các chủ đề mà con người chúng ta hiểu là nhỏ hơn đáng kể và con số này đang tăng với tốc độ thấp hơn nhiều.

Điều này cho thấy sự trùng lặp không có thứ tự của các ý tưởng giống nhau được chia sẻ trên một số nội dung bạn tìm thấy trên Internet. Bằng cách sắp xếp các chi tiết của một chủ đề bằng hệ thống bán cấu trúc, thông tin trên Internet có thể chiếm không gian nhỏ hơn và sẽ không bị trùng lặp nhiều.

Lợi ích của việc có nguồn dữ liệu khác nhau

Bằng cách lưu trữ thông tin về một chủ đề, việc trích dẫn nhiều nguồn dữ liệu trở nên dễ dàng hơn và bạn không còn phải đưa người dùng đến cùng một trang web nữa. Điều này cho chúng tôi biết rằng Google có thể và thực sự thu thập các chi tiết nổi bật về các chủ đề và hiển thị chúng bằng màn hình hoặc một loạt các phương tiện khác nhưng theo cách được cải thiện cho truy vấn của người dùng hoặc người dùng.

Về lý thuyết, thông tin về một chủ đề đôi khi có thể được lấy từ các nguồn bên ngoài Internet.

Lợi ích về tính toàn vẹn thông tin

Mặc dù Sơ đồ tri thức của Google đôi khi được biết là chứa các lỗi và sự không chính xác thực tế, nhưng đôi khi nó bị thao túng bởi những kẻ xấu hoặc các chuyên gia SEO. Tuy nhiên, cách tiếp cận này có lợi ích là cung cấp một điểm trung thực duy nhất cho Google. Tuy nhiên, điều này có thể không đúng với các chủ đề gây tranh cãi.

Một thực tế mới về bất kỳ chủ đề nào cũng cần phải trải qua một số quy trình xác minh trước khi nó có thể được thêm vào biểu đồ tri thức của Google. Nhưng không chắc rằng Google sẽ thảo luận công khai về các ngưỡng này.

Về mặt tiêu cực, một điểm của sự thật có thể dễ bị sai lệch hoặc làm giảm tính đa dạng của thông tin nếu bản thân các nguồn dữ liệu đã bị tạp nhiễm.

Lợi ích truy xuất thông tin

Nhờ việc phân loại thông tin theo chủ đề của họ, việc truy xuất thông tin đã trở nên nhanh hơn nhiều bởi cả Google và những người dùng có thể đang tìm kiếm một kim thông tin trong một đống trang web.

Sơ đồ tri thức của Google được sử dụng ở đâu?

Đối với nhiều người dùng Android và điện thoại thông minh, biểu đồ kiến ​​thức chủ yếu được sử dụng cho tính năng "khám phá" trên màn hình chính của họ. Google sử dụng thông tin về hành vi của người dùng để hiểu chủ đề nào quan trọng nhất đối với bạn và họ có thể giúp người dùng tìm thấy các chủ đề liên quan đó dựa trên lịch sử sử dụng của họ.

Google xu hướng cũng là một nơi khác mà người dùng có thể tìm thấy các chủ đề thú vị. Từ đó, Google có thể đưa ra dấu hiệu về những chủ đề nào có liên quan chặt chẽ với nhau. Tuy nhiên, bằng chứng hiện tại cho thấy dữ liệu này hiện đang được thu thập bằng cách kéo các tìm kiếm khác của cùng một người dùng, điều này có thể dẫn đến các chủ đề liên quan không mong đợi xuất hiện.

Như với bảng điều khiển, khi người dùng nhập một truy vấn tìm kiếm có thể được trả lời bằng biểu đồ tri thức, bạn cũng nhận được kết quả tìm kiếm chất lượng hàng đầu. Thông thường, những kết quả này làm lu mờ kết quả tìm kiếm cốt lõi, dẫn đến việc đẩy các liên kết đến cha đẻ của trang web xuống dòng.

Những câu trả lời này cũng được hiển thị theo cách mà Google có thể sử dụng để cung cấp câu trả lời cho người dùng sử dụng tìm kiếm bằng giọng nói.

Phần kết luận

Các chủ đề được hiển thị nhiều trong tìm kiếm hình ảnh, vì vậy bạn có thể tìm thấy thông tin liên quan từ việc tìm kiếm bằng cách sử dụng hình ảnh của một địa điểm hoặc người có liên quan.

Đây là một ví dụ tuyệt vời về các cách mà Sơ đồ tri thức được sử dụng làm kho lưu trữ cho các nguồn dữ liệu khác ngoài các trang web.