Как отказаться от AppleBot, чтобы Apple не обучала ИИ на ваших сайтах

Конфиденциальность (все еще) прекрасная вещь

Значок времени чтения 2 минута. читать


Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Значок подсказки

Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее

Ключевые заметки

  • Applebot — это веб-сканер Apple, который поддерживает такие функции, как Spotlight, Siri и поиск Safari.
  • Им можно управлять через файл robots.txt, разрешая или запрещая сканирование и использование контента.
  • Applebot-Extended предлагает дополнительный контроль над использованием данных для обучения моделей ИИ.
Apple Intelligence на мероприятии WWDC 2024

Apple активно участвовала в мероприятии WWDC 2024 на этой неделе. Технологический гигант из Купертино объявил iOS 18 на базе ChatGPT обновление, среди прочего, такое как альтернатива Copilot, Apple Intelligence, а также SLM от Apple на устройстве (небольшая языковая модель), которая имеет параметры 3B для локального запуска ИИ, немного меньше по сравнению с Модель Microsoft Phi-3-mini.

Производители iPhone также — сказал что он собирает «общедоступные данные» через свой веб-сканер AppleBot для дальнейшего обучения ИИ, хотя об этом говорится в «Об AppleBot», на которой собираются данные только для улучшения таких функций, как Spotlight, Siri и результаты поиска Safari.

И хотя это «кажется» безобидным, у ваших веб-сайтов по-прежнему есть возможность отказаться от использования в обучении ИИ, потому что конфиденциальность — это прекрасная вещь. Чтобы отказаться от Applebot, вы можете добавить директивы в файл robots.txt вашего веб-сайта, запрещающие ему сканирование вашего сайта.

Как отказаться от AppleBot

1. Откройте свой файл robots.txt (или создайте его, если он не существует).

2. Добавьте следующие строки, чтобы запретить AppleBot

User-agent: Applebot
Disallow: /

    3. Сохраните файл и загрузите его в корневой каталог вашего сайта.

    4. Если вы также хотите отказаться от AppleBot-Extended, который контролирует использование данных для обучения моделей искусственного интеллекта Apple, добавьте также следующие строки:

    User-agent: Applebot-Extended
    Disallow: /

    Команда robots.txt file — это текстовый файл, используемый веб-сайтами для связи с веб-сканерами и роботами. Он предоставляет инструкции о том, какие части сайта могут сканироваться и индексироваться поисковыми системами и другими автоматизированными агентами. Вы можете проверить, как выглядит файл robots.txt вашего сайта, перейдя по адресу (yourdomain.com)/robots.txt.

    AppleBot-Extended, расширенная версия AppleBot, позволяет вам, как издателям, контролировать использование данных для моделей искусственного интеллекта Apple и следовать правилам метатегов для управления индексацией и рендерингом веб-страниц.

    «Applebot-Extended не сканирует веб-страницы. Веб-страницы, на которых запрещен Applebot-Extended, все равно могут быть включены в результаты поиска. Applebot-Extended используется только для определения того, как использовать данные, сканируемые пользовательским агентом Applebot», — говорится в объявлении Apple.