-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathtables.py
More file actions
40 lines (30 loc) · 1.6 KB
/
tables.py
File metadata and controls
40 lines (30 loc) · 1.6 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
import pandas as pd
import numpy as np
from scipy.stats import mannwhitneyu
# === Настройки ===
path = 'data-251019.xlsx'
# Загружаем таблицу
df = pd.read_excel(path)
# Исключаем анкеты с ошибками
exclude_ids = [2105212553, 2105364012, 2105434991, 2117312175, 2117477460]
df = df[~df["ID"].isin(exclude_ids)]
# Названия нужных колонок
col_loc = "Количество таблиц (коллекций) во всех хранилищах данных проекта"
col_support = "На момент начала вашей работы, описываемый далее проект был на ваш взгляд поддерживаемым"
# Преобразуем в числовой тип и убираем пропуски
df[col_loc] = pd.to_numeric(df[col_loc], errors="coerce")
valid = df[[col_loc, col_support]].dropna()
# Разделяем по группам
supported = valid[valid[col_support] == "да"][col_loc]
unsupported = valid[valid[col_support] == "нет"][col_loc]
# Проверяем распределения
print("Медиана поддерживаемых:", np.median(supported))
print("Медиана неподдерживаемых:", np.median(unsupported))
# Тест Манна–Уитни
stat, p = mannwhitneyu(supported, unsupported, alternative="two-sided")
print("\nMann–Whitney U =", stat)
print("p-value =", p)
if p < 0.05:
print("→ Различие статистически значимо (p < 0.05)")
else:
print("→ Различие статистически незначимо (p ≥ 0.05)")