Допринесе еднакво за тази работа с: Анджела М. Баб, Даниел К. Кнудсен, Скот М. Робесън

функция

Роли Концептуализация, куриране на данни, формален анализ, разследване, методология, софтуер, писане - оригинален проект, писане - преглед и редактиране

Семинар на Affiliation Ostrom, Университет Индиана, Блумингтън, Индиана, Съединени щати

Допринесе еднакво за тази работа с: Анджела М. Баб, Даниел К. Кнудсен, Скот М. Робесън

Концептуализация на ролите, куриране на данни, официален анализ, разследване, методология, писане - оригинален проект, писане - преглед и редактиране

Отделение по география, Университет Индиана, Блумингтън, Индиана, Съединени американски щати

Допринесе еднакво за тази работа с: Анджела М. Баб, Даниел К. Кнудсен, Скот М. Робесън

Концептуализация на ролите, куриране на данни, официален анализ, разследване, методология, писане - оригинален проект, писане - преглед и редактиране

Отделение по география, Университет Индиана, Блумингтън, Индиана, Съединени американски щати

  • Анджела М. Баб,
  • Даниел К. Кнудсен,
  • Скот М. Робесън

Фигури

Резюме

Цитат: Babb AM, Knudsen DC, Robeson SM (2019) Критика на целевата функция, използвана при изчисляването на пестеливия хранителен план. PLoS ONE 14 (7): e0219895. https://doi.org/10.1371/journal.pone.0219895

Редактор: Джейми И. Баум, Университет в Арканзас, САЩ

Получено: 23 януари 2018 г .; Прието: 4 юли 2019 г .; Публикувано: 22 юли 2019 г.

Наличност на данни: Всички релевантни данни се намират в хартията и нейните поддържащи информационни файлове.

Финансиране: Авторите не са получили конкретно финансиране за тази работа.

Конкуриращи се интереси: Авторите са декларирали, че не съществуват конкуриращи се интереси.

Въведение

Планът за пестеливост на храните (TFP) е основният лост на политиката зад Допълнителната програма за подпомагане на храненето (SNAP) [1], федерална програма за хранителна помощ, управлявана от Министерството на земеделието на САЩ (USDA). USDA изчислява четири диетични плана: либерален, умерен, евтин и пестелив. TFP е най-ниската цена от четирите диетични планове, разработени от USDA, и определя максималното разпределение на парична помощ за хранене на над 42 милиона американци [2]. SNAP, който представлява по-голямата част от бюджета на USDA, се основава на TFP като точно изчисление на това, което струва на най-бедните американци да придобият адекватно хранителна диета.

В ограничения 2–4 по-горе използваме L и U, за да представим съответно долните и горните граници.

Вторият модел, използван тук, е този, предложен от Уайлд и Льобрера [1] и включва минимизиране на сумата на квадратичните грешки: (2), който е обект на същите пет ограничения като модела (1). Уайлд и Льобрера [1] установяват, че подобен модел може да бъде за предпочитане, тъй като той предоставя решения, които обикновено отговарят на ограниченията на TFP, като същевременно не се различават от действителното потребление значително повече от разпределението на TFP на USDA.

Ние също така оценяваме трети модел, който се основава на неотдавнашна работа, която се аргументира за запазване на действителните величини (абсолютни стойности) на разликите между два вектора на данните, като мерки, при които квадратните разлики на величината ефективно претеглят големи отклонения повече от други [11,12]. Този модел има формата: (3) и също е обект на същите пет ограничения като модел (1). Докато моделите (2) и (3) изглеждат визуално сходни, минимизирането в модел 3, който използва най-малко абсолютни стойности, известни също като най-малки абсолютни отклонения (LAD), може да доведе до различни решения от тези, генерирани от модели с най-малки квадрати (2), тъй като демонстрирана от значителната литература за оценките на LAD, напр [13, 14, 15].

Окончателен модел, който оценяваме, се използва широко в проучванията за оптимизиране на диетата [16, 17, 18] и минимизира претегленото абсолютно отклонение на разпределенията и действителното потребление, изразено като дял от наблюдаваното потребление. Предимство на този подход е, че тази формулировка е нечувствителна към единиците, в които се измерва храната. От строго математическа гледна точка недостатък е, че ако наблюдаваната консумация на категория храна за която и да е възрастова/полова група е нула, стойността на модел (4) става недефинирана (по същия начин категориите храни с почти нулева наблюдавана консумация могат да причиняват нестабилности в модела). Целта на този последен модел е: (4) при спазване на петте ограничения на модела (1).

За да решим модели (2), (3) и (4), използваме нелинеен обобщен алгоритъм за редуциран градиент [19], който е реализиран в Microsoft Excel с помощта на добавка, създадена от Frontline Solvers. Използвани са множество методи за стартиране, за да се гарантира, че крайното решение е глобален, а не локален минимум. Нашата работа се фокусира върху три възрастови групи (14–18, 20–50 и 51–70-годишни мъже и жени), тъй като те улавят предимството на потребителите, вземащи решения, по SNAP и по този начин повлияни от TFP.

Две предупреждения са в ред по отношение на нашата работа. Първо, тъй като използваме специфични възрастови/полов диапазони, ние сме в състояние да определим набор от ограничения 3 (регулиращ калорийните ограничения) точно за възрастовите групи, спестявайки изчислително време. Второ, следваме практиката на USDA при определяне на горната граница на ограничението на натрий до по-високата от потреблението в САЩ и горната граница (UL) за натрий, установена от Диетичните насоки за американците от 2005 г. [20]. Само 51–70-годишните жени консумират по-малко натрий от UL от 2300 милиграма на ден. Използвайки UL за натрий за възрастови/полови групи, различни от жени на възраст 51–70 години, не съществува възможно решение за TFP за модела USDA [10] или за моделите, които докладваме тук.

Доброта на мерките за прилягане и рядкост

Ние се фокусираме върху способността на моделите (1) - (4) по-горе да възстановят действителното потребление при ограничения. За да оценим този аспект на пригодността на модела, използваме средноквадратичната грешка (RMSE) и средната абсолютна грешка (MAE). Докато RMSE се използва широко и е обичайно за оценка на пригодността на модела [21], MAE е по-подходящо да оценява линейно разликите между емпирично наблюдавани и разпределени стойности, независимо от разпределението на тези грешки [22]. Също така, без да се знае разпределението на вероятността (нормалността) на грешките, RMSE е по-малко интерпретируема, особено при сравняване на различни моделни решения [22]. Използвайки обозначението по-горе: (5) и (6), където n е броят на стоките в целевата функция (тук n = 58). Нито RMSE, нито MAE имат точни разпределения. В такива случаи за тестване на значимостта често се използват техники за зареждане. Тук обаче този подход няма смисъл, тъй като случайното пренареждане на разпределената консумация в повечето случаи ще доведе до набори от решения, които не отговарят на калоричните, хранителните или диетичните баланси (т.нар. „Пирамида“). Освен това променливостта на извадката в тази рамка за моделиране влиза чрез наблюдаваното потребление; обаче информация за разпределение в рамките на наблюдаваното потребление по възраст/пол не е налична.

Скромността на разпределението по модели (1) - (4) също е обезпокоителна, тъй като цетерис парабис по-малко оскъдни разпределения се предпочитат пред оскъдни разпределения по отношение на осигуряването на добре закръглена диета. Изчисляването на рядкостта използва две мерки - просто изброяване на броя на разпределенията, по-малко от един грам, и коефициента на Джини, който се изчислява, използвайки формулата за подредени данни: (7) където n е размерът на извадката, μ е средната стойност на вектора X, i е рангът на Xi, а Xi е i-тата стойност на вектор, сортиран във възходящ ред. Джини е стандартна мярка за неравномерност на разпределението, която е показана от Хърли и Рикард [23] като превъзходна мярка и за оценка на разредеността. Коефициентът на Джини има долна граница 0, когато всички стойности на вектора са равни и теоретична горна граница 1, когато всички стойности с изключение на една са нула (при безкрайно голяма популация). Подобно на аргументите по-горе, тук не се използват тестове за значимост или доверителни интервали за Gini Coefficients, тъй като те изискват методи за преизбиране, които създават неподходящи набори от решения.

Резултати

Изследването на Таблица 1 показва, че въз основа на приложените мерки за доброта на годност, всички модели (2–4) изглежда са по-добри от модела USDA за всички изследвани възрастови/полови групи. Освен това, базирайки се само на добрата пригодност, моделите (3) и (4) обикновено са по-добри от (2). За деца от 51 до 70 години моделите (2) и (3) са по-добри от (4).