MachineLearning:Категоризация

Материал из MachineLearning.

Версия от 17:20, 5 марта 2008; Yury Chekhovich (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Категоризация — это процесс структирования схожих статей по темам. Категории (наряду со списками, обзорными шаблонами и др.) помогают читателям находить информацию, даже в тех случаях, когда они не знают, как искомая тема называется, или сомневаются в том, что она вообще присутствует на страницах Ресурса. Сами категории внешне представляют из себя оглавления, где их содержание отсортировано по алфавиту.

Категоризация должна помогать читателям ориентироваться в материалах Ресурса. При этом количество категорий для отдельных статей должно быть разумным и оправданным. Названия категорий должны быть нейтральными и узнаваемыми.

Содержание

Добавление статьи в категорию

Статья из любого пространства имён может быть включена в любую категорию путём добавления тега-ссылки на страницу категории, образованного добавлением к имени категории ключевого слова Категория:, например:

[[Категория:Классификация]] 

Это соответствует ссылке на соответствующую страницу категории, располагающуюся в пространстве имён категорий.

Страница может быть внесена больше чем в одну категорию — нужно просто добавить несколько тегов. При просмотре отредактированной страницы эти ссылки отображаются не в основном тексте, а на полях страницы, в позиции, жёстко заданной используемой темой оформления (внизу при использовании Monobook, справа вверху — при использовании Стандартное). В противоположность автоматической сортировке списков категорий (см. ниже), список категорий на странице располагается в порядке следования соответствующих тегов.

Общие положения

Категории как один из ключевых способов организации информации Ресурса следует добавлять ко всем типам страниц, но при этом есть некоторые ограничения по форме и обьёму категоризации.

Для статей

Статьи являются основным содержанием Ресурса и грамотная категоризация очень важна для них. Наличие хотя бы одной категории в статье обязательно, по нескольким причинам: во-первых, это чуть ли не единственный способ найти информацию, не зная, как называется искомая статья, во-вторых, это значительно ускоряет внесение статьи в индекс поисковых систем, что опять увеличивает доступность статьи для читателей, ну и в-третьих, категоризация сама по себе — очень удобный способ структурирования, организации просмотра и поиска информации.

При этом есть определённые ограничения на количество категорий, в которые может быть внесена статья. Следует использовать наиболее конкретные категории. Если статья подходит по смыслу для категории А и её подкатегории Б, то её, как правило, следует включать только в Б. Исключением может быть тот случай, когда статья значима и для всей категории А (как правило, это обзорные статьи).

Страница категории

Новые категории могут быть созданы и исправлены так же, как и обычные страницы,

Страница категории состоит из нескольких частей:

  • текст описания, который может быть отредактирован так же как и любая другая страница;
  • автоматически создаваемый список подкатегорий и их количество; если подкатегории отсутствуют, то данный раздел не отображается;
  • автоматически создаваемый список страниц, включённых в данную категорию, кроме подкатегорий и изображений; их количество, называемое «числом статей»; если категория пуста, то отображается заголовок и строка «Категория пуста»
  • автоматически создаваемый список изображений с картинками предпросмотра (подсчёт количества не ведётся); если имя изображения длиннее 20 символов, оно обрезается и дополняется троеточием; в отличие от второй и третьей секции, рубрикации по первым буквам имени не происходит; также отсутствует подзаголовок, отделяющий этот раздел от раздела статей.

Данные списки содержат только ссылки на соответствующие страницы, для изображений даётся также ссылка на страницу описания.

Для подкатегорий

Если страница, внесённая в категорию, сама является категорией, она образует подкатегорию.

Например, вы можете редактировать Категория:Конференции и добавить в неё ссылку на Категория:Мероприятия. Категория «Конференции» станет подкатегорией категории Мероприятия».

Если для статей основополагающее правило «если что-то существенное в статье относится к теме такой-то категории, то статью следует поставить в эту категорию», то для подкатегорий правила несколько иные.

Подкатегории следует подбирать так, чтобы во всём дереве каждой категории не было ни одной статьи, которая к ней не относится. Таким образом, категория А может стать подкатегорией в категории Б только в том случае, если все её статьи и подкатегории всех уровней не выходят за рамки категории Б.


«Красные» категории

Наличие «красных» (ещё не созданных) категорий в статье в общем случае не является причиной их удаления. Причинами удаления категорий (как уже существующих, так и «красных») из статьи могут являться:

  • ошибки в названии категории или несоответствие принятым стандартам именования категорий в данном разделе — такие названия должны исправляться (не обязательно на уже существующие категории)
  • несоответствие названия категории тематике статьи
  • наличие более узкой категории в данной ветке, более точно соответствующей тематике статьи — в этом случае категория уточняется.
  • наличие в статье одновременно более общей и более узкой категорий из одной и той же ветки — в этом случае более общая категория из статьи удаляется.

Во всех остальных случаях категория должна быть оставлена.

Сортировка в категориях

Как уже было сказано выше, статьи в категориях сортируются в алфавитном порядке.

Порядок сортировки

Порядок сортировки в категориях идёт в соответствии с ASCII:

./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~

Пробел находится в начале данной последовательности. Буквы кириллического алфавита располагаются после данной последовательности и сортируются в соответствии с юникод-кодами:

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯабвгдежзийклмнопрстуфхцчшщьыъэюяЁё

Ключ сортировки

Для сортировки статей в категориях используются ключи сортировки. Есть два способа сортировки при помощи ключей:

  1. Добавление {{DEFAULTSORT:ключ сортировки}} устанавливает ключ сортировки по умолчанию для всех категорий, в которую входит статья;
  2. Добавление, [[Категория:Название категории|ключ сортировки]] в статье устанавливает сортировку для отдельно взятой категории.

Нет необходимости использовать ключ сортировки в тех случаях, когда название статьи состоит из одного слова, а также тогда, когда первое слово в заголовке и является ключевым.

Иногда требуется вынести статью в самое начало категории (как например в случае с обзорной статьёй) — для этого используйте специальный ключ сортировки, например, знак пробела или «*»: «[[Категория:Имя категории| ]]» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).

Конкретные особенности

Большинство статей не требуют использования ключа сортировки, к тем же которые требуют, следует подходить с осторожностью. Прежде чем вставлять ключ сортировки, следует спросить себя, на какую букву средний человек обычно станет искать ту или иную статьи, и только выяснив этот вопрос, можно приступать к действиям.


Служебные страницы

См. также

Личные инструменты