Жизнь бита данных: как данные влияют на образовательную политику
Данные необходимы. Мы используем его для постановки целей, отслеживания прогресса и выявления системного неравенства. Вы можете подумать, что в основном их можно найти в электронных таблицах, но в повседневной жизни мы постоянно обрабатываем данные: Что ты наденешь завтра? Лучше посмотрите прогноз погоды. Во сколько ты завтра пойдёшь на работу? Зависит от отчетов о дорожном движении.
A хорошее образование помогает нам отточить наши инстинкты о том, заслуживает ли доверия источник данных, например академический журнал, проходящий рецензирование, или газета, соблюдающая журналистские кодексы и этику. В последние годы недоверие к правительству и наука выросла – часто из-за преднамеренной дезинформации или отсутствия понимания как подтверждаются научные открытия.
В последние годы недоверие к правительству и науке возросло – часто из-за преднамеренной дезинформации или отсутствия понимания того, как проводятся научные исследования и как результаты проверяются в процессе экспертной оценки.
Здесь, в Вашингтонском STEM, мы полагаемся на данные, находящиеся в открытом доступе. Но как мы узнаем, что они надежны? В этом блоге мы рассмотрим, как мы получаем и проверяем данные, используемые в наших отчетах и информационных панелях.
Начнем с «Консуэлы», гипотетического работодателя в Спокане…
Все начинается с телефонного звонка
Телефон звонит, и Консуэла замечает код города (202) Вашингтона, округ Колумбия.
«Должно быть, это исследование BLS», — думает она, имея в виду Бюро статистики труда.
Консуэла владеет строительной компанией в Спокане. Каждый месяц она и десятки тысяч таких же работодателей предоставляют данные о занятости, производительности, использовании технологий и другие темы посредством автоматизированных телефонных опросов (телефонное интервью с помощью компьютера или CATI). В мире сбора данных Консуэла известна как администратор данных, поскольку она собирает и отправляет данные, а также работает с аналитиками запрашивающего агентства для подтверждения точности.
Консуэла открывает свою таблицу, в которой она отслеживает новых сотрудников. Она тянется к звонящему телефону. А кусочек* данных вот-вот родятся.
* портманто (смешение слов), сокращение от «двоичная цифра»
Источники данных
Миллионы битов данных от работодателей и других участников опроса поступают в базы данных, управляемые федеральными агентствами, такими как Бюро переписи населения США и Бюро статистики труда США, а также государственные учреждения, такие как Департамент обеспечения занятости и Министерство торговли и другие. В каждом из этих агентств есть команды аналитиков данных, которые собирают данные, устраняют ошибки (например, пустые ячейки или неправильно отформатированные даты), дезагрегируют их, то есть разделяют на составные части, и анонимизируют. На этом последнем шаге удаляется любая идентифицирующая информация, такая как имена или адреса, поэтому конфиденциальность данных человека обеспечивается.
Вашингтон STEM использует наборы данных с открытым исходным кодом (то есть общедоступные), из различные государственные и федеральные источники в нашем информационные панели и инструменты данных. Наши инструменты данных предоставляют новейшие исследования в области раннего ухода и образования, образования K-12 и карьерного роста для широкой общественности, включая законодателей, преподавателей, работодателей, общественные организации, чтобы они могли понимать, где они находятся, прогнозировать будущие потребности и обеспечить надежную связь между образованием и рабочей силой.
Наши инструменты данных предоставляют новейшие исследования в области раннего ухода и образования, образования K-12 и карьерного роста для широкой общественности, включая законодателей, преподавателей, работодателей, общественные организации, чтобы они могли понимать, где они находятся, прогнозировать будущие потребности и обеспечить надежную связь между образованием и рабочей силой.
Данные об образовании в Вашингтоне
Но когда дело доходит до отчетности о результатах образования — основы нашей Панель инструментов STEM в цифрах— мы полагаемся на данные Центра данных исследований образования (ERDC), расположенного в Управлении финансового управления. Законодательный орган создал ERDC в 2007 году для сбора и управления данными об образовании в Вашингтоне — от дошкольных учреждений до колледжей и рабочей силы — набор продольных данных, известный как «P20W». Эти данные собирают четырнадцать государственных агентств, в том числе Управление суперинтенданта народного образования (OSPI), Департамент по делам детей, молодежи и семьи (DCYF), Департамент здравоохранения и социальных служб, Государственный совет общественных и технических колледжей и другие.
Администраторы данных в каждом из этих агентств, как и Consuela, несут ответственность за сбор данных своих программ, таких как набор учащихся и демографические данные, оценки готовности к математике в детском саду и количество выпускников. Затем администратор загружает данные на портал ERDC, где они проходят проверку качества перед добавлением в главную базу данных.

«Мы получаем данные из множества различных источников данных, а затем должны объединить их в нашем хранилище данных. В результате мы всегда проводим валидацию и проверки качества», — сказала Бонни Нельсон, старший специалист по управлению данными в ERDC.
Нельсон сказал, что уникальность ERDC в Вашингтоне заключается в том, что он располагает «межотраслевым хранилищем продольных данных», то есть связывает несколько записей одного отдельного студента. «Каждый студент создает запись, когда идет в школу, колледж, а затем, когда устраивается на работу. ERDC объединяет все это в одной записи».
Оттуда данные поступают в публикации ERDC, включая отчеты по дошкольному образованию, результатам обучения и другим. Нельсон сказал, что основными пользователями ERDC являются законодатели штатов, политики, государственные агентства, университетские исследователи и общественные организации. По закону ERDC обязан предоставлять данные общественности либо через онлайн-панели or по запросу.
«Наша задача — быть распорядителями и связующими звеньями — мы не должны оградить людей от данных, а сказать им: «У нас есть кое-что, что вы можете найти интересным», и помочь им получить доступ к данным для улучшения результатов и опыта учащихся».
В прошлом году Вашингтон STEM и сетевые партнеры обратился к 739 пользователям данных по всему штату, включая практиков, преподавателей, исследователей, политиков, общественных лидеров и правозащитников, чтобы спросить, используют ли они данные и как, и с какими проблемами они столкнулись при этом. Результаты показывают, что 90% используют данные при принятии решений и планировании, но менее 20 из 739 пользователей данных заявили, что они чувствуют себя хорошо осведомленными о государственной инфраструктуре данных P20W или знают, к какому агентству обращаться по вопросам, связанным с данными. Чтобы улучшить емкость данных, в течение следующих четырех лет Вашингтон STEM будет обеспечивать профессиональное развитие и техническую помощь для улучшения способности этих партнеров работать с данными, которые они используют.

Данные историй могут рассказать
В Washington STEM мы не просто собираем данные и создаем информационные панели для развлечения. (Хотя визуализация данных — это весело.просто спросите нашего специалиста по данным.) Как говорилось в начале, данные важны для постановки целей, измерения прогресса и выявления системных проблем.
Например, пять лет назад координатор карьеры и готовности к поступлению в среднюю школу Якимы у него было предчувствие, что набор студентов в программы двойного зачета в его школе – часто связанный с увеличением вероятности продолжения высшего образования – не был справедливым, но у него не было данных, чтобы доказать это.
Поэтому он обратился в вашингтонский STEM за помощью в доступе и анализе данных о прохождении курсов. Результаты продемонстрировали гендерные и этнические различия: латиноамериканские мужчины с меньшей вероятностью поступали в систему двойного зачета и продолжали получать высшее образование.

Как только школьные администраторы узнали свои данные, они смогли внести существенные улучшения, чтобы помочь большему количеству учащихся получить доступ к программам двойного кредита. В 2022 году законодатели приняли закон, требующий от всех школ сообщать о демографических данных студентов при зачислении на двойной кредит. Вашингтон STEM продолжает расширять эту программу через сотрудничество от средней школы к послесреднему, при этом более 40 школ по всему штату начинают использовать информационные панели данных увидеть свои собственные данные и внести изменения на уровне школы.
Аналогично, перед Закон о честном старте для детей был принят в 2021 году, данные о потребностях и предложениях по уходу за детьми не были доступны общественности. Мин Хванбо, вашингтонский директор по вопросам STEM, сказал: «Новый закон требует большей прозрачности данных. В результате Департамент по делам детей, молодежи и семьи в партнерстве с Вашингтонским STEM создал пять Панели раннего обучения, обеспечивающие широкий обзор отрасли».
«В целом, наблюдается недостаток последовательных и точных данных о нескольких ключевых группах населения: детях с ограниченными возможностями, бездомных детях и детях коренных американцев».
-Мин Хванбо, директор по воздействию STEM в Вашингтоне
Хотя информационные панели раннего обучения и «Положение детей» панель данных и региональные отчеты увеличили доступность данных, но не для всех детей.
«Отсутствует последовательная и точная отчетность по нескольким ключевым группам населения: детям с ограниченными возможностями, бездомным детям и детям коренных американцев», — сказал Хванбо. По его словам, это связано с тем, что сбор некоторых данных в сфере ухода за детьми был добровольным, а во время пандемии этого просто не происходило в некоторых регионах штата. В течение Процесс совместного проектирования «Состояние детей», Вашингтон STEM изучил наборы данных с участием членов каждого из этих сообществ, и многие из них сказали, что цифры кажутся заниженными.
Призывы к созданию центра обмена данными по раннему обучению
Хотя такие агентства, как ERDC, DCYF и OSPI, собирают некоторые данные о дошкольниках, в настоящее время не существует центрального информационного центра для комплексных данных на уровне населения о раннем обучении. Хванбо сказал: «Существующая инфраструктура данных в различных программах и организациях затрудняет доступ семьям к необходимой поддержке, а администраторам сложно использовать данные для улучшения поддержки детей и семей».
Вашингтон STEM рекомендует создать центр обмена данными по всему штату, чтобы улучшить доступ к данным, чтобы каждый — законодатели, преподаватели, исследователи, родители — могли иметь все, что им нужно для планирования и улучшения нашей системы раннего ухода и образования.
Вашингтон STEM рекомендует создать центр обмена данными по всему штату, чтобы улучшить доступ к данным, чтобы каждый — законодатели, преподаватели, исследователи, родители — могли иметь все, что им нужно для планирования и улучшения нашей системы раннего ухода и образования.
Итак, независимо от того, являетесь ли вы фанатом данных или впервые погружаетесь в мир данных, мы приглашаем вас использовать Инструменты обработки данных Вашингтонского университета STEM. И в следующий раз, когда вы услышите экономические отчеты в утренних новостях, подумайте о Консуэле и других администраторах данных, которые стоят за этими цифрами.
«Какой инструмент обработки данных STEM в Вашингтоне мне следует использовать?»
Основные
BLS — Бюро статистики труда США
Перепись — Бюро переписи населения США
CCA — Информация об уходе за детьми
COMMS — Департамент торговли штата Вашингтон
DCFY — Департамент по делам детей, молодежи и семьи штата Вашингтон
ECEAP — Программа помощи в дошкольном образовании
ERDC — Департамент обеспечения занятости штата Вашингтон
ОФМ — Управление финансового менеджмента
OSPI — Управление суперинтенданта народного просвещения