Педагогическая практика

Сентябрь 02, 2015 By: admin Category: Разное

Малоинформативные признаки можно сразу же исключить из анализа. Строгих критериев полезности признаков не имеется, так как в одном случае целесообразно оставлять и малоинформативные, в другом случае — оставлять только высокоинформативные Это зависит от количества имеющихся в распоряжении исследователя признаков, от стоимости, надежности и доступности сбора информации о них и от других обстоятельств. Во всяком случае, ориентируясь на полученные оценки расхождения и коэффициенты aR, исследователь решает вопрос об исключении того или иного признака из анализа. Кроме того, может случиться, что сразу будут исключены многие признаки, и в многомерном предсказателе их останется слишком мало для разделения групп.

Строгих критериев достаточности признаков также не имеется, но в общем это несложно определить по конкретным данным исследования: если алгоритм дает слишком великое с точки зрения практики число «отказов» (т.е., слишком много объектов остается вЪоне сомнительности»), количество признаков следует увеличить.

Идеальной была бы совокупность признаков, применение которой привело бы к отнесению.всех объектовв ту или иную группу, без единого объекта в «зоне сомнительности». Но в педагогических и психологических исследованиях это возможно, видимо, только в тривиальных случаях, когда лучшее решение достаточно очевидно и не требует применения математического аппарата. В обычных же ситуациях даже при большом числе признаков встречаются объекты, которые приходится оставлять в «зоне сомнительности».

При предсказании групповой принадлежности объектов признаки рассматриваются последовательно, начиная с обладающего наибольшей различительной способностью. Иначе говоря/ уравнение s — ajXj + а2х2+ … + а„хпстроится так, чтобы на первом месте стояли переменные хк, относящиеся к признаку с наибольшей различительной способностью, далее — переменные второго по различительной способности признака и т.д. Последовательно суммируем те коэффициенты aR# которые соответствуют положительному элементарному наблюдению, и как только достигнут одного из заданных пределов — верхнего или нижнего, процесс прекращается и соответствующее решение считается принятым. Если же будут рассмотрены все признаки и тем не менее ни один из пределов не будет достигнут, объект остается в «зоне сомнительности», решение относительно его не принимается. В таком случае следует или понизить уровень надежности решения, или собрать дополнительную, информацию, кото-, рая содействовала бы принятию решения.

Вообще говоря, строгое доказательство оптимальности данного алгоритма имеется только для случая, когда все признаки предсказателя распределены одинаковой отличаются только средними характеристиками. Но практика применения последовательного днализа показала, что нарушение этого условия не дает существенных отклонений в результатах. Поэтому применение последовательного анализа целесообразно и при различных распределениях признаков предсказателя.

Если известно, что в генеральной совокупности, которую придется классифицировать на практике, объекты из двух групп будут встречаться неодинаково часто и известны вероятности; с которыми они будут встречаться (априорные вероятности, которые обычно также оцениваются относительными частотами), то добавляется свободйый член уравнения.

Алгоритм Бейеса, или формула апостериорной вероятности, в своей сущности не отличается от алгоритма Вальда. Более того, описанный выше алгоритм выведен из формулы апостериорной вероятности и поэтому называется Бейесовой постановкой последовательного различения двух простых гипотез.

Comments are closed.



Категории:


Дошкольное образование