Автор работы: Пользователь скрыл имя, 16 Мая 2012 в 19:51, курсовая работа
В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.
Введение……………………………………………………………………4
1.Теоретическая часть: Теоретические аспекты психологии………..6
1.1. Общее понятие психологии…………………………………………….6
1.2. Когнитивная психология………………………………………...13
1.3. Применение статистических методов в когнитологии……………….24
2. Аналитическая часть: Проведение психологического исследования и обработка результатов…………………………………………….............38
2.1. Анализ анкеты с помощью метода сводки и группировки данных……………………………………………………………………….38
2.2. Средние величины……………………………………………………..39
2.3. Определение -критерия……………………………………………...44
2.4. Ранговая корреляция………………………………………………..….46
3. Рекомендации и предложения по теме исследования: когнитивный диссонанс и способы выхождения из когнитивного диссонанса………..51
Заключение……………………………………………………………….57
Список используемой литературы……………………………...…58
Кластерный анализ (КА). В целом алгоритмы КА можно разделить на два основных направления - это разбиение данных на некоторые группы (кластеры) и иерархическая классификация данных. В качестве объектов анализа могут выступать как случаи (субъекты исследования), так и случайные переменные. Общая идея первого направления КА заключается в том, что случаи (или переменные) рассматриваются как точки векторного пространства с определенной на нем метрикой (функцией расстояний) d(X,Y) и затем разбиваются на группы близких относительно этой метрики обьектов, называемых кластерами. В качестве метрики используются евклидово расстояние (S (xi - yi)2)1/2, расстояние Чебышева max{|xi - yi |} и др. Обьекты анализа определяются исходной матрицей Т либо матрицей расстояний. Пусть задана матрица Т. Выделим классифицирующее множество признаков - переменные Х1,..,Хk. Тогда каждый случай представим как точка в k-мерном пространстве V. Естественно предполагать, что геометрическая близость точек в V соответствует близости соответствующих объектов по своим характеристикам. Это определяет геометрический подход, не требующий никаких вероятностных предположений. Другой подход основан на предположении, что матрица Т определяет выборку из смеси унимодальных распределений, и задача выделения групп сводится либо к оценке параметров этих распределений (параметрические методы), либо к поиску модальных значений (точек локального максимума) непараметрической оценки Парзена для функции плотности вероятности. Параметрические методы, например, алгоритм Дея (см. [5, 9.1.4]), близки методам дискриминантного анализа. Обычно при этом предполагается, что распределение выборки есть взвешенная сумма многомерных нормальных распределений. Во втором случае рассматривается функция Парзена P(X,h) = c(h, p) S exp(-1/h2 (X - Xj)T (X -Xj)), дающая непараметрическую оценку плотности распределения случайных величин Х1,.., Хk. Здесь c(h, p) - нормирующая константа, p - параметр сглаживания. Если данные образуют сгущение в n-мерном пространстве, то P(X,h) будет иметь локальный максимум (модальное значение ) в точке, близкой к центру сгущения. Таким образом, определяя модальные точки функции P(X,h), мы определяем количество классов, на которые можно разбить данные, и центры этих классов, вокруг которых затем группируем данные.
Иерархические методы классификации основаны на включении групп данных Di, рассматриваемых как единичные объекты, в некоторую иерархическую структуру, отражающую близость этих групп. В качестве Di могут выступать отдельный случай или переменная. Определяя расстояние между группами d(Di , Dj) (например, как расстояние между центрами групп d(Ci, Cj )) и рассматривая Di как вершины некоторого графа G с ребрами между Di и Dj длины di,j = d(Di, Dj ), мы получим интерпретацию задачи на языке теории графов. Иерархическая структура на множестве объектов {Di} определяется путем нахождения минимального покрывающего дерева, т.е. графа без циклов, такого, что суммарная длина его ребер минимальна. Эта процедура реализуется по правилу "ближайшего соседа" - выделяется ребро минимальной длины di,j, соответствующая пара объектов Di, Dj объединяется в один объект (т.е. добавляется новая вершина графа, соединенная с вершинами Di, Dj,), в получившемся графе снова выделяется ребро минимальной длины и т.д. В результате мы получаем иерархическое дерево, в котором вершины низшего уровня есть исходные объекты, а остальные вершины определяют уровни иерархической структуры. В других алгоритмах используются методы разрезания дерева по самому длинному ребру (вроцлавская классификация) либо по ребру с максимальным весом w=dn1n2, где d - длина ребра, а n1, n2 - количество вершин поддеревьев, получающихся после разреза дерева, содержащего данное ребро (см. [11]).
Критерии согласия. Критерии согласия предназначены для обнаружения расхождений между гипотетической моделью и данными, которые эта модель призвана описать. Они используются для проверки применимости предположения о законе распределения случайной величины либо для проверки гипотезы об однородности выборки. Обычно, полагая выборочные среднее и отклонение оценкой параметров гипотетического распределения, используют критерии Колмогорова-Смирнова, омега-квадрат для переменных с большой вариативностью значений, и критерии хи-квадрат К.Пирсона или Р.Фишера для дискретных переменных с небольшим числом значений. Для проверки однородности распределений в подвыборках, извлеченных из генеральной совокупности с нормальным распределением, используют t-критерий Стьюдента для средних и критерий Бартлетта для дисперсий. При проверке однородности выборок относительно ординальных переменных используют ранговые критерии однородности - критерий Вилкоксона и критерий нормальных меток Фишера-Йэтса. [25, c. 367-381]
2. Проведение психологического исследования и обработка результатов
2.1. Анализ анкеты с помощью метода сводки и группировки данных.
Сводка – комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность для выявления типичных черт и закономерностей присущих изучаемому явлению в целом.
Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным существенным признакам.
Проанализируем информацию, полученную путем опроса респондентов, в таблице 1:
Таблица 1
Помощь сети Интернет при выборе вуза и своей специальности
Факультет | Помощь сети Интернет при выборе вуза и своей специальности, чел. | |||
Да, активно | Да | Да, немного | Нет | |
ФЭУ | 2 | 7 | 15 | 21 |
ФИТ | 18 | 24 | 11 | 15 |
УНИТ | 5 | 12 | 6 | 17 |
УНТИ | 11 | 13 | 8 | 16 |
МТФ | 5 | 16 | 11 | 17 |
ФЭЭ | 9 | 19 | 16 | 9 |
Итого | 50 | 91 | 67 | 95 |
Сформируем группы по формуле Стерджесса:
n = 1 + 3,322 lgN.
n = 1 + 3,322 * lg 6 = 3,507
Таким образом n=4.
Факторным признаком для данной группировки выберем количество утвердительно ответивших на данных вопрос (активное использование интернета при выборе специальности).
x макс. = 18
x мин. = 2.
R= 18-2=16.
h = R / n = 16 / 4= 4.
Получаем следующие интервалы:
1. 2-6;
2. 6-10;
3. 10-14;
4. 14-18.
Таблица 2
Группировка факультетов по количеству ответивших утвердительно на вопрос об активном использовании сети Интернет при выборе специальности в БГТУ
Количество ответивших «Да, активно» | Факультеты | Количество ответивших «Да» | Количество ответивших «Да, немного» | Количество ответивших «Нет» |
2-6 | ФЭУ, УНИТ, МТФ | 7; 12; 16 | 15; 6; 11 | 21; 17; 17 |
6-10 | ФЭЭ | 19 | 16 | 9 |
10-14 | УНТИ | 13 | 8 | 16 |
14-18 | ФИТ | 24 | 11 | 15 |
Итого: | 6 | 91 | 67 | 95 |
2.2. Средние величины
Средняя арифметическая
Средняя арифметическая простая используется в тех случаях, когда известны отдельные значения варьирующего признака по каждой единице совокупности.
где - средняя величина;
- индивидуальные значения признака;
n - число вариантов.
Определим среднее количество ответов на вопрос о способах подготовки при поступлении в БГТУ за 2007-2010 года в таблице 3:
Таблица 3
Способы подготовки для поступления в БГТУ за 2007-2010 года
Год | Варианты ответов | |||
Самостоятельно | Подготовительные курсы | Занятия с репетиторами | Другое | |
2007 | 7 | 4 | 9 | 0 |
2008 | 3 | 1 | 2 | 0 |
2009 | 10 | 13 | 25 | 0 |
2010 | 82 | 10 | 94 | 1 |
Итого | 102 | 28 | 130 | 1 |
В среднем | 25,5 | 7 | 32,5 | 0,25 |
Вывод: за 4 года, т.е. с 2007 по 2010 наибольшее количество человек отдавало предпочтение занятиям с репетитором в качестве способа подготовки для поступления в БГТУ, на втором месте – самостоятельная подготовка, среднее количество человек, посещавшее подготовительные курсы – 7, другие же способы подготовки для поступления практически не были использованы.
1). Мода
Мода в интервальном вариационном ряду распределения рассчитывается по формуле:
где - начальная (нижняя) граница модального интервала;
- шаг модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному интервалу;
- частота интервала, следующего за модальным интервалом.
Если интервальный ряд с неравными интервалами, то мода определяется в интервале, имеющем наибольшую плотность распределения, и в формуле
Определить моду по следующим данным (интервальный ряд):
Таблица 4
Группировка факультетов по количеству ответивших утвердительно на вопрос об активном использовании сети Интернет при выборе специальности в БГТУ
Количество ответивших «Да, активно» | Факультеты |
2-6 | ФЭУ, УНИТ, МТФ |
6-10 | ФЭЭ |
10-14 | УНТИ |
14-18 | ФИТ |
Итого: | 6 |
Информация о работе Статистика в психологии. Применение статистических методов в когнитологии