Nếu bạn gặp rắc rối với tin tức ngày hôm qua rằng Automattic, công ty sở hữu WordPress.com và Tumblr, đang bán dữ liệu của bạn cho các công ty lập mô hình AI, có lẽ nó không đáng để nhấn mạnh. Nghe có vẻ mờ ám khi công ty thu lợi nhuận từ nội dung của người dùng, phần lớn những gì chúng tôi đưa vào internet hiện tại đã được sử dụng bởi các bot AI đói khát để đào tạo ngôn ngữ.
Tuy nhiên, tin tức này đã đưa ra một sự nhầm lẫn phổ biến xuất hiện bất cứ khi nào cuộc thảo luận chuyển sang các vấn đề về WordPress và một điều quan trọng nếu bạn lo lắng liệu việc môi giới dữ liệu này có ảnh hưởng đến mình hay không: Sự khác biệt giữa WordPress, hệ thống quản lý nội dung và WordPress là gì. com, trang web lưu trữ web—và trang web WordPress cá nhân của bạn có nằm trong dữ liệu được bán không?
WordPress là gì?
Như đã nêu, WordPress là một hệ thống quản lý nội dung (CMS) được sử dụng trên khoảng 40% tổng số trang web. Cách đơn giản nhất để mô tả CMS là cơ sở dữ liệu nơi tất cả nội dung của trang web được lưu trữ, kết nối với mã web tiêu chuẩn—cho dù đó là html, php, javascript, ruby hay django—cho dữ liệu biết trông như thế nào và hoạt động như thế nào khi được truy cập.
Để phân tích nó trong thực tế: Chẳng hạn, nội dung của một bài đăng trên blog—các từ, hình ảnh, liên kết và tiêu đề—được lưu trữ trong cơ sở dữ liệu. Mã web (thường được gọi là “chủ đề”) cho trang web biết nền nên có màu gì, căn chỉnh văn bản và hình ảnh sang trái hay phải, phông chữ nào sẽ sử dụng cũng như vị trí đặt hình ảnh và kích thước của chúng và bố cục chung sẽ như thế nào.
Lý do mọi người sử dụng CMS như WordPress rất đơn giản: Viết mã trang web bằng tay rất tệ và kết quả có thể cực kỳ không nhất quán. Sử dụng CMS có nghĩa là bạn có thể thực hiện các thay đổi chung cho chủ đề và đảm bảo dữ liệu có thể di chuyển được, nghĩa là bạn có thể dễ dàng xuất và sử dụng ở nơi khác. Bạn luôn có thể thay đổi chủ đề của mình và do đó thay đổi bố cục, màu sắc, phông chữ và mọi thứ khác, nhưng dữ liệu trong cơ sở dữ liệu vẫn không thay đổi.
WordPress ra mắt khoảng 20 năm trước và trở thành lựa chọn phổ biến của các đối thủ cạnh tranh như Moveable Type và Drupal vì nhiều lý do. Mặc dù trong một thời gian ngắn nó chỉ được coi là một công cụ viết blog, nhưng WordPress và các CMS khác đã nhanh chóng được coi là những công cụ hữu ích để tạo các trang web đầy đủ chức năng cho doanh nghiệp. Ngày nay, blog chiếm một phần nhỏ nội dung CMS.
WordPress cũng trở nên phổ biến vì lý do đơn giản nhất: Nó miễn phí (về mặt kỹ thuật).
Bản thân WordPress—có nghĩa là các tệp tạo nên khung cơ bản của CMS—được cung cấp miễn phí theo giấy phép nguồn mở có tên là GPL. Nói tóm lại, bạn không cần phải trả tiền cho mã WordPress cũng như bất kỳ sản phẩm phái sinh nào. Bạn chỉ có thể tải nó xuống từ WordPress.org và cài đặt nó trên bất kỳ máy chủ web nào bạn muốn hoặc cục bộ trên máy tính của bạn. Đây là thứ mà mọi người thường gọi là “WordPress tự lưu trữ”, và tại thời điểm này, hầu hết mọi nhà cung cấp dịch vụ web đều có tiện ích để họ cài đặt WordPress cho bạn.
Mặc dù bạn không thể tính phí cho chính WordPress, nhưng một ngành công nghiệp lớn có lớn lên xung quanh các chủ đề và plugin WordPress tùy chỉnh, đồng thời phát triển tất cả các loại chức năng xung quanh phần mềm.
WordPress.com là gì?
Ngày nay, WordPress được duy trì bởi một cộng đồng tình nguyện viên ổn định nhà phát triểnvà nhãn hiệu này thuộc quyền sở hữu của Nền tảng WordPress, một tổ chức phi lợi nhuận 501c3. Trang web WordPress.org được liên kết với WordPress Foundation.
Trong khi đó, những người phát minh WordPress thành lập công ty riêng của họ, như đã nói ở trên Tự độngvà sản phẩm đầu tiên của họ là bán các trang web WordPress được lưu trữ trên máy chủ. Nói cách khác, bạn có thể tự lưu trữ một trang web WordPress ở bất cứ đâu hoặc bạn có thể lấy nó trực tiếp từ nguồn tại WordPress.com.
Nếu bạn bối rối, đừng lo lắng; nó đã khiến mọi người bối rối trong hai thập kỷ và là chủ đề tranh luận thường xuyên. Để đơn giản, hãy nghĩ theo cách này: Nếu bạn truy cập WordPress.com để đăng nhập vào trang web của mình, nội dung trang web của bạn có nguy cơ bị sử dụng để đào tạo các mô hình AI. Nếu trang web của bạn được lưu trữ ở bất kỳ nơi nào khác ngoài WordPress.com (như trên GoDaddy, Bluehost hoặc Siteground), thì bạn có một trang web WordPress tự lưu trữ.
Sự khác biệt giữa WordPress tự lưu trữ và .com được lưu trữ
Mặc dù dựa trên cùng một công nghệ cơ bản, nhưng có sự khác biệt giữa hai trải nghiệm WordPress và không chỉ ở việc bạn trả tiền cho việc lưu trữ trang web của mình. WordPress.com là một trải nghiệm được kiểm soát chặt chẽ hơn nhiều, với các plugin, chủ đề và tùy chọn hạn chế. Quan trọng nhất, nó cung cấp hỗ trợ khách hàng. Bạn cũng có thể trả tiền cho nhiều nâng cấp khác nhau về tiện ích, như tên miền của riêng bạn hoặc dịch vụ sao lưu.
WordPress tự lưu trữ không có ràng buộc nào, đây vừa là một điều may mắn vừa là một lời nguyền. Bạn có thể cài đặt bất kỳ plugin nào bạn muốn hoặc viết plugin của riêng bạn. Bạn có thể sử dụng bất kỳ chủ đề nào bạn muốn hoặc tự mình viết mã. Về mặt lý thuyết, nó là của bạn, từ dữ liệu đến tên miền và máy chủ lưu trữ. Nhưng nếu bạn phá vỡ nó bằng cách nào đó, bạn sẽ phải tìm ra cách viết mã để thoát khỏi nó.
Dữ liệu WordPress của bạn có thực sự gặp rủi ro không?
Theo như chúng tôi biết hiện tại, mối quan tâm về AI chủ yếu giới hạn ở các trang web WordPress.com—những trang được lưu trữ tại WordPress.com. Bạn có thể từ chối đưa dữ liệu của mình vào chương trình bằng cách điều chỉnh cài đặt trên trang WordPress.com của bạn. Nếu bạn tự lưu trữ, có vẻ như dữ liệu của bạn không được bán cho các đối tác AI của Automattic.
Tuy nhiên, điều đó không có nghĩa là nó không được sử dụng để đào tạo các mô hình AI, đơn giản vì nó có trên internet. Các bot AI tìm kiếm nội dung giống như cách các công cụ tìm kiếm tìm kiếm nội dung. Và như Biên tập viên công nghệ cấp cao của Lifehacker, Jake Peterson đã lưu ý ngày hôm qua, nhiều trang web WordPress tự lưu trữ sử dụng một plugin có tên Jetpack. Jetpack là tập hợp các dịch vụ mà Automattic có thể cung cấp cho WordPress tự lưu trữ, bao gồm CDN, sao lưu, giám sát thư rác, v.v. Vì Jetpacks là dịch vụ dựa trên đám mây kết nối cơ sở dữ liệu của bạn với Automattic nên nó có thể được sử dụng giống như cách Automattic đang sử dụng các trang web WordPress.com.
Hôm qua, Tự động X‘d (chính thức được gọi là tweet) rằng WordPress.org không được đưa vào nội dung dành cho mô hình AI, nhưng nó không giải quyết được câu hỏi cụ thể về việc Jetpack được sử dụng làm cổng cho nội dung đó.