-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathbook_1_1.html
348 lines (256 loc) · 67.4 KB
/
book_1_1.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
<!DOCTYPE html>
<head>
<meta charset="UTF-8">
<html lang=en>
<meta name="viewport" content="width=device-width, initial-scale=1">
<title>Концептуализация пространственных отношений</title>
<meta name="description" content="Геопространственный анализ, Концептуализация пространственных отношений: дистанция, смежность, взаимодействие" />
<link rel="canonical"
href="https://www.example.com/keywords.html" >
<link rel="stylesheet" type="text/css" href="style.css">
<link rel="preload" href="c:/fonts/montserrat/montserrat.woff2" as="font">
<link href= "https://fonts.fontstorage.com/import/montserrat.css">
<style>
* {
box-sizing: border-box;
}
figure {
width: 47%; /* Ширина если надо расположить 2 картинки в ряд*/
float: left; /* Выстраиваем элементы по горизонтали */
margin: 0 0 0 0%; /* Отступ слева */
text-indent: 0px; /* убираем отступ для картинки как ни странно */
/* background: #f0f0f0; /* Цвет фона */
border-radius: 1px; /* Радиус скругления */
padding: 1%; /* Поля */
}
figure:first-child {
margin-left: 0; /* Убираем отступ для первого элемента */
}
picture {
width: 30%; /* Ширина если надо расположить 3 картинки в ряд*/
float: left; /* Выстраиваем элементы по горизонтали */
margin: 0 0 0 0%; /* Отступ слева */
text-indent: 0px; /* убираем отступ для картинки как ни странно */
/* background: #f0f0f0; /* Цвет фона */
border-radius: 1px; /* Радиус скругления */
padding: 1%; /* Поля */
}
picture:first-child {
margin-left: 0; /* Убираем отступ для первого элемента */
}
image {
width: 100%; /* Ширина если надо расположить 1 картинки в ряд*/
float: left; /* Выстраиваем элементы по горизонтали */
margin: 0 0 0 0%; /* Отступ слева */
text-indent: 0px; /* убираем отступ для картинки как ни странно */
/* background: #f0f0f0; /* Цвет фона */
border-radius: 1px; /* Радиус скругления */
padding: 1%; /* Поля */
}
</style>
</head>
<div class="sidenav">
<a href="#h1">I. ОСНОВЫ ПРОСТРАНСТВЕННОГО АНАЛИЗА</a>
<a href="#h2">1. КОНЦЕПТУАЛИЗАЦИЯ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ</a>
<a href="#h3_1">1.1. Геопространственный анализ</a>
<a href="#h3_2">1.2. "Что", "Где" и "Почему" - три этапа геопространственного моделирования</a>
<a href="#h3_3">1.3. Концептуализация пространственных отношений: дистанция, смежность, взаимодействие</a>
<a href="#h3_4"></a>
<a href="#h3_5"></a>
</div class="sidenav">
<div class="content">
<h1 id="h1">I. ОСНОВЫ ПРОСТРАНСТВЕННОГО АНАЛИЗА</h1>
<h2 id="h2">1. КОНЦЕПТУАЛИЗАЦИЯ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ</h2>
<h3 id="h3_1">1.1. Геопространственный анализ</h3>
<p>Американскому профессору статистики и консультанту по менеджменту <b>Уильяму Эдвардсу Демингу (W. Edwards Deming)</b> приписывают замечательное в своем роде выражение <i>"В Бога мы веруем. Все остальные пусть предоставят данные"</i>, смысл которого заключается в том, что без настоящих данных и работы с ними невозможно постижение истины. Наблюдения и измерения, параметры и характеристики (т.е., данные) - лежат в основе любого современного исследования и давно уже стали неотъемлемой частью управления, что, возможно, особенно ярко проявилось в самые последние годы в связи с разными кризисами: экономическими, экологическими, наконец - в связи с пандемией. Без надежных и правильным образом обработанных данных нет "доказательной науки", следовательно, нет и адекватной реакции, корректного управления ситуацией.</p>
<p>Статистика, как раздел математики, посвященный работе с данными, как известно, появилась не вчера, однако с момента изобретения географических информационных систем <span class="bolditalic">(ГИС)</span> возникла возможность привязывания данных к местоположению - возможность, обогатившая географию методами так называемого пространственного анализа. Огромные массивы непространственных данных, получив координатную привязку, стали "работать" на объяснение в географии, что привело к пересмотру многих традиционных представлений и появлению новых теорий.</p>
<a id="Snow"><img src="Pict_1_1/01_Snow.png" width="60%"></a>
<br><span class="imgtitle">Рис. 1.1 Карта Джона Сноу (1854 г.), на которой отмечены случаи холеры и водозаборные колонки</p>
<p>Можно возразить, что интуитивный пространственный анализ существовал и ранее: достаточно вспомнить интригующую историю про открытие источника холеры в Лондонском Сохо <b>Джоном Сноу</b>, составившим карту <a href="#Snow">(Рис. 1.1)</a>, на которой были отмечены места расположения водоразборных колонок и дома с заболевшими и умершими от холеры. Предполагается, что анализ увеличения плотности точек вблизи колонок привел врача к выводу об источнике возбудителя заболевания. Но согласимся - только относительно недавно мы получили возможность "привязывать" сотни тысяч и даже миллионы объектов и событий к географической "подоснове" и заниматься геопространственной статистикой.</p>
<p>Геопространственный анализ позволяет отображать множество отдельных событий (например - преступления, заболевания), так и множество различных свойств в пределах разных <span class="monospace">операционно-территориальных единиц (ОТЕ)</span>; например - преступность или заболеваемость в границах отдельных районов или кварталов города <a href="#03_Cancer">(Рис. 1.2)</a>.</p>
<a id="03_Cancer"><img src="Pict_1_1/03_Cancer.png" width="60%"></a>
<br><span class="imgtitle">Рис. 1.2 Онкологические заболевания (2005-2009) по кварталам Нью-Йорка (фрагмент) как пример отображения явления по матрице операционно-территориальных единиц</p>
<p>Согласно <span class="bolditalic">Л. Анселину</span> <a href="BIBLIO.html#Anselin1989">[Anselin, 1989, стр. 2]</a> <span class="bolditalic">пространственный анализ - это количественное изучение пространственно распределенных явлений</span>. По <span class="bolditalic">П. Лонгли</span> с соавторами пространственный анализ - это <span class="bolditalic">"процесс, посредством которого мы превращаем необработанные данные в полезную информацию в погоне за научными открытиями или более эффективным принятием решений" </span><a href="BIBLIO.html#Longley_et_al_2011">[Longley et al., 2011, p. 17]</a>. Одно из последних определений принадлежит <b>Г. Грекоузису</b> : <span class="bolditalic">"пространственный анализ - это совокупность методов и статистических данных, которые объединяют такие понятия, как местоположение, площадь, расстояние и взаимодействие, для анализа, исследования и объяснения в географическом контексте"</span> <a href="BIBLIO.html#Grekousis2020">[Grekousis, 2020, p. 2.]</a>.</p>
<p>Так или иначе на сегодняшний день пространственный анализ это уже целая научная сфера которая включает <a href="BIBLIO.html#Sullivan_2010">[O’Sullivan, Unwin, 2010, p.3]</a>:</p>
<ul>
<li>манипулирование пространственными данными с помощью географических информационных систем (ГИС),
</li>
<li>анализ пространственных данных описательным и исследовательским способом,
</li>
<li>пространственную статистику, которая использует статистические процедуры для получения "объясняющих" выводов и причинно-следственных связей, </li>
<li>построение моделей для выявления взаимосвязей и прогнозирования результатов в пространственном контексте.</li>
</ul>
<p>Методы пространственного анализа вносят ценный вклад в понимание как природных, так и социальных систем. В геоэкологии методы пространственного анализа могут быть применены в исследованиях самого широкого спектра природных явлений и процессов - от изменения глобального и регионального климата, до исследований геохимических полей, определения направленности и скорости неблагоприятных процессов экзогенной геодинамики, изучение загрязнения воздушного бассейна городов, оценки изменения ландшафтных метрик, характеризующих структуру природной среды и т.д. В экономике методы пространственного анализа могут быть использованы для анализа, картографирования и моделирования взаимосвязей между людьми и различными аспектами экономической жизни; таким образом мы можем изучать различные причины бедности, социального неравенства и т.д.. В социальных исследованиях пространственный анализ может оказаться полезным в изучения того, как люди взаимодействуют в социальном, экономическом и политическом контекстах, что позволяет, например, выявить причины преступности и девиантного поведения.
</p>
<p>В отечественной практике ГИС-моделирования термин <span class="bolditalic">Пространственный Анализ</span> появился как прямой перевод англоязычного термина <span class="bolditalic">Spatial Analysis</span>, в этой связи не всегда легко провести различие между пространственным анализом и географическим или геопространственным анализом, тем более, что все три термина использовались множеством авторов в самых различных контекстах. В общем случае термин <span class="bolditalic">географический (или геопространственный) анализ</span> относится к поверхности Земли с ее характерным рельефом суши, растительным покровом и акваторией Мирового Океана. <span class="bolditalic">Пространственный Анализ</span>, вероятно, несколько шире, поскольку он может относится к разным типам объектов (например - к другим планетам), и, что важнее - к разным категориям пространств. Так для анализа визуальных свойств фрагментов городской среды (общественных пространств или кварталов с домами) важно представлять ее как совокупность трехмерных объемов, с экранирующими взгляд плоскостями и диапазонами развертки так называемых "вист" (вееров оптических осей созерцания). Подобный анализ в большей степени "пространственный" чем "географический", не случайно для его реализации существуют специальное программное обеспечение <span class="blackbold">Depthmaps</span>.</p>
<p>Основным преимуществом пространственного анализа является способность выявлять закономерности, которые ранее не были определены или даже не наблюдались. Например, используя методы пространственного анализа, можно определить кластеризацию возникающих заболеваний, а затем разработать механизмы для предотвращения его распространения. Точно также можно выявить причины наступающей ксерофитизации растительного покрова в регионе, факторы пожароопасности или заболачивания лесов и т.д. В этом отношении пространственный анализ приводит к лучшему принятию решений в пространственном планировании <a href="BIBLIO.html#Grekousis_2019">[Grekousis, 2019]</a>. Не случайно многие методов пространственного анализа, например - <span class="blackbold">MSPA|Структурный анализ</span> все чаще включаются в арсенал инструментов архитектурного проектирования, градостроительства и районной планировки.</p>
<p>В широком смысле существует четыре типа пространственного анализа:</p>
<p>1) <span class="bolditalic">Анализ точечных данных</span> с целью выявления одного из трех типов распределений: кластерного, рассеянного, случайного</i></span>. Классический пример - распределение преступлений или заболеваний. Относительно обоих этих феноменов непустым является вопрос распределены ли они случайно или сгруппированы в кластеры или образуют некую другую, возможно - регулярную мозаику ("паттерн"). В случае обнаружения кластеров мы можем задаться следующим вопросом: какие факторы (экологические для заболеваемости и социальные - для преступности) могут служить причинами формирования кластеров? Анализ распределения точек также включает в себя различные меры центральности - так называемую <span class="bolditalic">центрографику</span> - набор статистических переменных, используемых для определения центральных мест и выявления причин явления.</p>
<p>2) <span class="bolditalic">Пространственный анализ</span> для полигональных (ареальных) данных, используемый для индивидуального и типологического районирования, а также для конфигурирования различного рода зональных сущностей как естественных (природных зон, экорегионов) так и социальных (участков переписи, почтово-индексных кварталов, планировочных городских районов, функциональных территориальных зон. Пространственная статистика помогает выявлять пространственную неоднородность и пространственную зависимость, демонстрируя, например, как группируются кварталы с различным уровнем доходов или как кластеры экорегионов с различными биоклиматическими показателями объединяются в природно-ландшафтные зоны. Таким образом, <span class="bolditalic">регионализация</span> выступает основным проявлением концептуализации пространства в этом виде анализа.</p>
<p>3) <span class="bolditalic">Анализ геостатистических (непрерывных) данных</span> можно считать частью <span class="bolditalic">теории поля</span>, поскольку этот раздел статистики позволяет анализировать и моделировать непрерывные покрытия и гриды. Сюда можно отнести преобразования, проводимые над <span class="bolditalic">цифровыми моделями рельефа</span> с целью получения геоморфометрических переменных (например, уклона и экспозиции). С геостатистикой связывают также <span class="bolditalic">интерполяцию</span>, применяемую для заполнения разрывов в данных, таким образом например, обработкой данных многих сотен наземных метеостанций получают растры климатических переменных (например, среднегодовых температур или индекса влажности).</p>
<p>4) <span class="bolditalic">Пространственное моделирование</span> (в узком смысле) иногда считают отдельным видом пространственного анализа, относя к нему причинно-следственный (например - регрессионный анализ) и так называемую пространственную эконометрику</span> <a href="BIBLIO.html#Grekousis_2020">[Grekousis, 2020]</a>.</p>
<p>Все виды пространственного анализа имеют дело с <span class="bolditalic">пространственными данными</span>. В свою очередь, пространственные данные относятся к пространственным объектам, которые обладают геометрическими параметрами и пространственной привязкой, но которые также могут характеризоваться и другими непространственными атрибутами <a href="BIBLIO.html#Bivand et al_2008">[Bivand et al., 2008, p. 7]</a>. Например, мы можем описать сельскую местность по целому спектру данных, характеризующих землепользование, социальную инфраструктуру и экологическую ситуацию, включив в разрабатываемую модель данные о локализации и планировочной структуре населенных пунктов, структуре сельскохозяйственных угодий, конфигурации дорожной сети, размещению социальных объектов (дошкольных учреждений, школ и больниц), локализации пожарных депо, контейнерных площадок для ТБО, сохраняющихся природных ландшафтах, и так далее. Когда эти данные связаны с местоположением с помощью пространственных атрибутов (координат, адресной системы), мы получаем пространственные данные с которыми можно оперировать различным образом - в зависимости от изучаемой проблемы.</p>
<p>Представление объектов в рамках геоинформационного моделирования достигается комбинированием данных двух типов: <span class="bolditalic">векторных геометрических примитивов</span> с "подшитыми" атрибутами и так называемых полей - непрерывных мозаик <span class="bolditalic">растровых данных</span>. Геометрические примитивы включают точки, полилинии и полигоны, за которыми в разных масштабах могут закрепляться разные семантики. Так точка может отображать отдельное дерево в модели крупного масштаба, биогруппу - в модели среднего масштаба или островной массив леса в мелкомасштабной модели. Точно также полигон может соответствовать отдельному строению, кварталу или целому населенному пункту. Поля (fields) презентуют объекты и явления как поверхность с непрерывно меняющимися свойствами: таковы поверхности рельефа (ЦМР), климатические характеристики или растры так называемых ландшафтных метрик.</p>
<p> <span class="bolditalic">Атрибуты или переменные</span> - это взаимозаменяемые термины, обозначающие любую характеристику, которой может обладать тот или иной объект (например площадь, высота, уровень содержания гумуса в почве и т.д.). Конкретное выражение переменной принято называть <span class="bolditalic">значением</span>.</p>
<br>
<h3 id="h3_2">1.2. "Что", "Где" и "Почему" - три этапа геопространственного моделирования</h3>
<p>В руководствах по использованию пакета <span class="red">ArcGIS</span>, разработанных известной американской компанией ESRI, традиционно предлагается рассматривать процесс пространственного анализа как рабочую последовательность, включающую постановку вопросов <span class="bolditalic">"What|Что", "Where|Где" и "Why-How|Почему"</span>. Этой последовательности соответствуют три раздела пространственной статистики: <span class="bolditalic">Descriptive Statistics|Дескриптивная Статистика</span>, <span class="bolditalic">Exploratory Spatial Data Analysis|Исследовательский Анализ Пространственных Данных</span> и, собственно, <span class="bolditalic">Inferential Statistics and Spatial Statistics|Выводная Статистика и Пространственное Моделирование</span>. "Рабочей" эту последовательность делает простое обстоятельство невозможности приступить к последующему разделу не пройдя предыдущего.</p>
<p>На вопрос "Что?" можно получить ответ с использованием методов <strong>дескриптивной (описательной) статистики</strong> <a href="BIBLIO.html#Таблица 1.1">(Таблица 1.1)</a>, которая позволяет охарактеризовать данные, выявить характер распределения данных (нормальное, экспоненциальное, "паретианское"), обнаружить выбивающиеся значения (выбросы). Дескриптивная статистика использует карты (векторные и растровые слои ГИС) <a href="#02_Престпн_точки">(Рис. 1.3)</a>, таблицы, графики, простые статистические процедуры для обобщения конкретной выборки (допустим - мест совершения преступлений в границах городского района), по этой причине ее результаты не являются репрезентативными для характеристики более обширного множества (преступлений в границах всего мегаполиса).</p>
<a id="04_Muder_2021.png"><img src="Pict_1_1/04_Muder_2021.png" width="60%" height="relative"></a>
<br><span class="imgtitle">Рис. 1.3 Места ("точки") совершения преступлений в Нью-Йорке в кварталах Куинса за 2021 г. как пример отображения явления в рамках дескриптивной статистики</p>
<br>
<a id="Таблица 1.1"><span class="imgtitle">Таблица 1.1 ГИС-инструментарий дескриптивного анализа, задачи и использование</p>
<div class="table">
<table id="customers">
<table border="1">
<tr>
<th>ЗАДАЧА</th>
<th>ИНСТРУМЕНТЫ </th>
<th>СОДЕРЖАНИЕ</th>
</tr>
<tr>
<td>Презентация слоя данных в ГИС</td>
<td>Применение символов масштабирования и типологического различения объектов</td>
<td>Выбор варианта оформления переменной\признака в соответствии с гипотезой модели, наличным набором данных и оформлением других переменных (как векторных, так и растровых)</td>
</tr>
<tr>
<td>Характеристика распределения данных, расчет Z-балла</td>
<td>Фоновая картограммы (хороплет),<br> Гистограммы,<br> Основные статистические данные (асимметрия, эксцесс и др.),<br> Диаграммы размаха,<br> QQ-графики</td>
<td>Выявление мест с высоким или низким значением переменной (например уровня преступности или уровня заболеваемости);<br> Определение нормальности, искаженности либо ненормальности распределения;<br> Выявление выбросов значений</td>
</tr>
<tr>
<td>Анализ набора переменных на наличие попарной корреляции</td>
<td>Точечные диаграммы,<br> Матрицы точечных диаграмм</td>
<td>Выявление наличия\отсутствия и определение знака (продолжительная\отрицательная) линейной связи между переменными;</td>
</tr>
</table>
<p><strong>Исследовательский анализ пространственных данных|Exploratory Spatial Data Analysis - ESDA</strong> применяется для изучения и картографирования данных, обнаружения выбросов, проверки базовых предположений или выявления тенденций и ассоциаций между ними, таких как наличие <strong>пространственной автокорреляции</strong> или <strong>пространственной кластеризации</strong> <a href="#Таблица 1.2">(Таблица 1.2)</a>. На этом этапе мы в основном отвечаем на вопрос "где?", выявляя, например, где располагаются ареалы с загрязненными почвами, или определяя где находятся районы с низкими/высокими значениями дохода, оценивая существует ли какая-либо пространственная кластеризация в распределении дохода по домохозяйствам, или анализируя где находятся "горячие точки" преступности в городе <a href="#05_Muder_Pd_2004_2020">(Рис. 1.4)</a>.</p>
<a id="05_Muder_Pd_2004_2020"><img src="Pict_1_1/05_Muder_Pd_2004_2020.png" width="60%" height="relative"></a>
<br><span class="imgtitle">Рис. 1.4 Анализ переменной Point Density|Плотность Точек совершений убийств за 15 лет в Нью-Йорке позволяет выявить своего рода - ареалы концентрации тяжелых преступлений</span>
<br>
<a id="Таблица 1.2"><span class="imgtitle">Таблица 1.2 ГИС-инструментарий исследовательского (ESDA) анализа, задачи и использование
<div class="table">
<table id="customers">
<table border="1">
<tr>
<th>№</th>
<th>ЗАДАЧА</th>
<th>ИНСТРУМЕНТЫ </th>
<th>СОДЕРЖАНИЕ</th>
</tr>
<tr>
<th>1</th>
<td>Анализ географического распределения объектов и событий</td>
<td>Средний центр,<br> Медианный центр,<br> Стандартное расстояние,<br> Стандартный отклоняющийся эллипс</td>
<td>Выявление центральных местоположений для множества объектов;<br> Определение вектора (пространственного тренда) явлений и феноменов</td>
</tr>
<tr>
<th>2</th>
<td>Анализ точечного паттерна</td>
<td>Среднее Ближайшее соседство,<br> K-Рипли статистика</td>
<td>Выявление случайного, рассеянного или кластерного характера пространственного распределения объектов;<br> Определение дистанции дисперсии или кластеризации</td>
</tr>
<tr>
<th>3</th>
<td>Создание карт плотности распределения множества объектов или явлений</td>
<td>Плотность ядер,<br> Плотность точек</td>
<td>Выявление ареалов высокой и низкой плотности (концентрации) объектов и явлений</td>
</tr>
<tr>
<th>4</th>
<td>Выявление значений локальных выбросов в данных</td>
<td>Признак в точки,<br> Ближайший объект (Near)</td>
<td>Выявление значений и пространственной локализации выбросов; <br>Удаление выбросов</td>
</tr>
<tr>
<th>5</th>
<td>Выявление пространственной автокорреляции переменных</td>
<td>Матрица пространственных весов,<br> Пошаговая пространственная автокорреляция,<br>Пространственная автокорреляция (Глобальный индекс Морана I),<br> Анализ кластеров и выбросов (Anselin, Локальный индекс Морана I)</td>
<td>Концептуализация пространства посредством создания матрицы пространственных весов;<br> Выявление кластеров высоких и\или низких значений переменной в пространстве;<br> Определение горячих или холодных точек;<br>Оптимизированный анализ горячих точек;<br> Определение масштаба анализа</td>
</tr>
<tr>
<th>6</th>
<td>Мультифакторная (многомерная) кластеризация данных</td>
<td>Анализ группирования,<br> Кластеризация k-средних</td>
<td>Определение кластеров (типологическое районирование) или индивидуальных районов (регионализация) в зависимости от условий соседства и определения расстояний</td>
</tr>
<tr>
<th>7</th>
<td>Анализ сходства</td>
<td>Поиск сходства</td>
<td>Поиск объектов аналогичных целевому, в качестве альтернативного потенциального местоположения</td>
</tr>
</table>
<p>На последнем этапе мы пытаемся ответить на вопросы "почему?" или "как?" для объяснения и понимания причин и следствий с помощью моделей так называемой <span class="blackbold">Explanatory Statistical Analysis - ESA|Объяснительной Статистики</span>. В контексте объясняющего, или, употребляя более привычные в отечественной практике термины - <span class="bolditalic">причинно-следственного анализа </span> - мы рассматриваем переменные как независимые или зависимые. <span class="bolditalic">Зависимая переменная</span> (или эффект) - это явление/состояние/переменная, которую мы пытаемся объяснить. Например - почему события преступности сконцентрированы в определенной области, и как эта аномалия связана с уровнем дохода на душу населения, стоимостью домов, этническим\расовым составом населения, образованием и уровнем безработицы среди мужчин трудоспособного возраста.</p>
<p>Другой весьма распространенный пример зависимой переменной причинно-следственного анализа - заболеваемость, которую мы пытаемся объяснить такими факторами как загрязнение воздушного бассейна города промышленными выбросами, напряженность транспортного трафика, качество воды, используемой для водозабора и сохранность зеленой инфраструктуры. Устанавливаемые таким образом в регрессионных моделях связи-соотношения выявляют степень влияния фактора (<span class="bolditalic">независимой переменной</span> модели) на эффект - <span class="bolditalic">зависимую переменную</span> <a href="#Таблица 1.3">(Таблица 1.3)</a>. Такого рода модели помимо того, что они создают новые знания, обычно используются для предсказания и прогноза, и, следовательно, могут рассматриваться и как инструменты планирования. Например, если установлена связь между уровнем подтопления городских кварталов во время экстремальных осадков и площадью незапечатанных и озелененных территорий, то эта зависимость может быть использована для разработки стратегии "голубой инфраструктуры" города и проектирования дополнительных дренажных систем.</p>
<br>
<a id="Таблица 1.3"></a><span class="imgtitle">Таблица 1.3 ГИС-инструментарий "объяснительного" (ESA) анализа, задачи и использование</p>
<div class="table">
<table id="customers">
<table border="1">
<tr>
<th>ЗАДАЧА</th>
<th>ИНСТРУМЕНТЫ </th>
<th>СОДЕРЖАНИЕ</th>
</tr>
<tr>
<td>Моделирование отношений</td>
<td>Исследовательская регрессия,<br> Метод наименьших квадратов (OLS)</td>
<td>Моделирование зависимой переменной на основе набора факторов</td>
</tr>
<tr>
<td>Моделирование отношений с учетом веса географических факторов</td>
<td>Географически взвешенная регрессия</td>
<td>Моделирование зависимой переменной на основе набора факторов с учетом географической неоднородности пространства</td>
</tr>
</table>
<br>
<br>
<h3 id="h3_3">1.3 Концептуализация пространственных отношений: дистанция, смежность, взаимодействие</h3>
<p>География не могла бы претендовать на "звание" науки, если бы ее предметом не были пространственные отношения. Соответственно и географический (пространственный) анализ ничем не отличался бы от обычного статистического анализа, если бы в его основе не лежали простые (на первый взгляд) представления о расстоянии, и связанные с ними понятия "близко", "далеко", "рядом", "по соседству". </p>
<p><span class="bolditalic">"Первый закон географии Тоблера (TFL)"</span> был введен в географическую литературу в статье, которую <strong>Уолдо Тоблер</strong> опубликовал в журнале "Экономическая география" в 1970 году <a href="BIBLIO.html#Tobler_1970">[Tobler, 1970]</a>. В этой статье, описывающей моделирование роста численности населения в Детройте, Тоблер заявил, что для того, чтобы его модель заработала, он "применит первый закон географии: <span class="bolditalic">все связано со всем остальным, но близкие вещи связаны более, чем отдаленные"</span>. С тех пор это утверждение неоднократно подвергалось сомнению и критике (см. например <a href="BIBLIO.html#Waters_2018">[Waters, 2018]</a>, особенно в процессе разработки различных способов определения самого понятия близость, а также каких понятий как "похожесть", "соседство" и "взаимосвязь" для программных продуктов пространственного анализа, таких как <span class="blackbold">GeoDa</span>, пакета <span class="blackbold">R-статистики</span> и, наконец, <span class="red">ArcMAP10.x</span>.</p>
<p>Однако, так или иначе, места не изолированы друг от друга. Экологические и физико-географические, социальные и экономические взаимодействия разворачиваются в пространстве и происходят между соседними или отдаленными положениями, следовательно сами эти взаимодействия/отношения имеют пространственное измерение. Когда мы применяем методы анализа пространственных данных, мы должны прозрачным образом и точно определить, насколько близок "близкой объект", как идентифицируется "смежность", каков размер окрестности и как мы можем интегрировать состояние объекта в моделях, включающих структуру. Это означает, что мы должны установить ряд географических параметров для определения пространственных отношений - совокупность которых принято называть <span class="bolditalic">концептуализацией географического пространства</span> <a href="BIBLIO.html#Anselin_2010">[Anselin, 2010]</a>.</p>
<p>Важнейшим свойством концептуализированного пространства является его <span class="bolditalic">масштабируемость</span>. На самом простом уровне масштаб сцены моделирования определяет тип презентации объекта. Так река в мелком масштабе может быть отображена полилинией, в более крупном полигоном, стороны которого совпадают с урезом воды, а внутренняя площадь - с акваторией. Аналогично любой город на карте мира отображается точкой, но на карте региона город будет выглядеть как обширный полигон, разбивающийся на административные районы и полигоны наполняющих их кварталов.</p>
<p>Однако существует и более сложный эффект, связанный с масштабируемостью географического пространства. <span class="bolditalic">Применяя более обобщенный масштаб для отображения объектов или явлений, мы можем потерять внутреннюю неоднородность, обнаруживаемую на локальном масштабе</span>. Такие утраты неизбежны и соответствуют классическим закономерностям генерализации в традиционной бумажной картографии: изображая гидрографическую сеть в мелком масштабе картографы "жертвуют" притоками низких порядков, и на итоговой карте мы наблюдаем только главные речные стволы. Однако такое решение приводит к странным эффектам, если информация одного слоя (слоя источника) подвергается обобщению по матрице, используемого в качестве операционно-территориальных единиц другого слоя, например, когда мы изучаем загрязнение, заболеваемость, доходы или преступность в рамках сетки административно-территориального деления. </p>
<p>Эффект подобного рода искажений получил название <span class="bolditalic">"Modifiable Areal Unit Problem MAUP)"</span>, что можно перевести как <span class="bolditalic">Проблема Меняющейся Размерности Операционно-территориальной Единицы"</span>. "Каноническим" примером <span class="monospace">MAUP</span> являются президентские выборы в США 2000 года, в которых Эл Гор получил больше голосов, чем Джордж Буш, но проиграл выборы из-за сетки избирательных округов внутри каждого штата <a href="BIBLIO.html#Sullivan_2010">[O’Sullivan, Unwin, 2010, p. 38]</a>. Иная размерность сетки могла бы привести к другому результату.</p>
<p><span class="monospace">MAUP</span> относится как к масштабу анализа, так и к агрегированию данных. Как правило, при использовании крупных территориальных единиц, мы агрегируем данные на более высоком уровне, чтобы обобщение было более очевидным, автоматически делая агрегированные значения, как правило, больше похожими на общее среднее (глобальное среднее), тем самым отклоняясь от медианных значений и делая выбросы значений менее заметными.</p>
<div class="script_01">
<figure>
<a id="06_TOTPOP_tracts"><img src="Pict_1_1/06_TOTPOP_tracts.png" width="100%" height="relative"></a>
</figure>
<figure>
<a id="07_TOTPOP_nbrhd"><img src="Pict_1_1/07_TOTPOP_nbrhd.png" width="100%" height="relative"></a>
</figure>
</div>
<br>
<span class="imgtitle">Рис. 1.5 Пример влияния сетки ОТЕ на представление и характер распределения данных: картограммы численности населения Нью-Йорка: a) по кварталам|tracts, b) по микрорайонам|neighborhood (7 классов, "геометрические интервалы")
<p>На двух картограммах численности населения Нью-Йорка <a href="#06_TOTPOP_tracts">(Рис. 1.5)</a> обобщенной по двум разным сеткам операционно-территориальных единиц (ОТЕ): <span class="monospace">кварталам (tracts)</span> и <span class="monospace">микрорайонам (Neighborhood)</span> можно видеть, как выраженный кластерный характер плотности заметно искажается на уровне "соседств" за счет, во-первых, включения в оценку кварталов с резко различной плотностью, во вторых, по причине учета на верхнем уровне ненаселенных (парковых, общественно-деловых и коммерческих) территорий.</p>
<p><span class="bolditalic">Пространственная неоднородность как разница между значениями набора наблюдений внутри исследуемой области - другое свойство концептуализации пространства</span>. Неоднородны любые географические данные - от биоклиматических показателей (температура, осадки) до поверхности "дневного" рельефа, от уровня заболеваемости до уровня доходов, при этом переходы значений могут быть как постепенными, так и резкими. Неоднородность пространства обостряет обычную задачу статистики - задачу выборки данных и, следовательно, интерпретацию результатов моделирования. Так например, мы можем получить в модели кластеры с аномально высокими показателями онкологической заболеваемости, но может оказаться, что выделенные кластеры связаны со значительной концентрацией и плотностью населения, т.е., поле одного из факторов модели само по себе обнаруживает неоднородность, и следовательно мы не можем делать какие-либо выводы об экологических факторах, которые (потенциально) могли бы выступать в роли причин данной аномалии.</p>
<p>Во многих случаях пространственную зависимость нелегко отличить от пространственной неоднородности: этот эффект <strong>Л. Анселин</strong> назвал <span class="bolditalic">invers problem</span> <a href="BIBLIO.html#Anselin_2010">[Anselin, 2010]</a>, что приблизительно можно перевести как "обратная задача". В географическом пространстве корреляция или ковариация между переменными в разных местах определяется расположением объектов. Другими словами, обнаруживая пространственные структуры (<span class="bolditalic">паттерны</span>) изучаемого явления (например, заболеваемости) мы не можем сразу утверждать что они присущи именно этому явлению, а не являются результатом неоднородности вовлеченных в анализ факторов, имеющих собственную мозаику пространственного распределения.</p>
<p>Другая проблема пространственного анализа, так называемая <span class="bolditalic">Проблема краевых эффектов</span> связана с выбором сцены моделирования: модели редко охватывают весь земной шар (хотя и такие существуют). Конфигурируя сцену в соответствии с задачами модели мы невольно создаем края (например краевые пиксели Цифровой Модели Рельефа), которые не имеют соседей со всех сторон, это обстоятельство может создавать искажения, например в задаче определения направления стока и моделирования эрозионно-речной сети.</p>
<p><span class="bolditalic">Ecological Fallacy|Экологическое заблуждение</span> - ошибка которая возникает когда предполагается, что связь, статистически значимая на одном уровне анализа, сохраняется и на более детальном уровне и когда используются агрегированные данные верхнего уровня для моделирования ситуации на более локальном. Данные о преобладании типов лесорастительных условий на уровне лесного квартала не могут быть использованы для типов леса по лесным выделам, хотя подобный соблазн может возникнуть, например в задачах интерполяции для заполнения недостающих данных. <span class="bolditalic">Одна из причин Ecological Fallacy - принципиально различный характер пространственного распределения одних и тех же объектов на разных масштабных уровнях и даже просто в разных ареалах на одном и том же уровне</span>.</p>
<p>Существуют различные методы концептуализации пространственных отношений, каждый из которых позволяет лучше смоделировать внутреннюю структуру пространственного набора данных с точки зрения пространственной смежности и формирования окрестностей. Общепринятыми являются следующие три.</p>
<div class="script">
<strong> А. Расстояние </strong> - позволяет определить пороговое (критическое) значение расстояния или так называемую функцию расстояния, для характеристики этого фактора используются:<br>
<strong>Тип расстояния</strong> - связано со способом его расчета (например, Евклидово, Манхэттенской, Минковского, Сетевое расстояние),<br>
<strong>Фиксированный диапазон расстояний</strong>порог расстояния, критическим образом меняющий зависимость феномена от дистанции в ту или иную сторону (ослабление, усиление),<br>
<strong>Прекращение влияния (decay) расстояния</strong> значение, за пределами которого расстояние не играет какой- либо роли.<br>
<strong> B. Смежность </strong> - определяет условия смежности:
<li>Смежность ребер полигонов(случай Ладьи),</li>
<li>Смежность углов (узлов) полигонов (случай Королевы),</li>
<li>Смежность более высокого порядка,</li>
<li>Смежность взаимодействия, включающее и расстояние и соседство.</li>
<strong> C. Окрестности</strong> - определяет условия соседства:
<li> k-ближайшие соседи,</li>
<li>Полигоны близости,</li>
<li>Триангуляция Делоне.</li>
<strong> D. Пространственно-временные отношения</strong> - определяют пространственный охват и интервалы времени для модели<br>
</div>
<p>В разных моделях используются разные пространственные отношения: для исследования пассажиропотоков наземного транспорта в большом городе используют манхеттенское расстояние, поскольку уличная сеть состоит из параллельных и поперечных отрезков; при изучении влияния эффекта "опушки" - уменьшения фактора тревожности для фауны птиц в лесном массиве решающее значение приобретает обычная прямая дистанция; функция <strong>decay</strong> полезна для исследования влияния лесополосы на микроклимат сельскохозяйственных угодий.</p>
<p>Концепция <span class="bolditalic">Distance Decay</span>, пожалуй, наиболее интересна для ГИС-моделирования, ибо она <span class="bolditalic">позволяет учесть изменение силы влияния фактора расстояния для разных переменных и явлений</span>. Интуитивно мы склонны приписывать непрерывное, плавно ослабляющееся влияние расстояния на значения атрибутов соседних пространственных объектов; таково, например, воздействие водохранилища на водно-воздушный режим почв в прибрежном лесном массиве. В действительности связь между фактором и расстоянием может быть более сложной, например, нелинейной или экспоненциальной. Кроме того, функция расстояния может иметь пороговое значение, после которого влияние расстояния уже не меняется. Еще один вариант, когда функции свойственно "плато" - дистанция, в пределах которой значения не меняются, а за границей - начинают уменьшаться (так выглядит функция уровня шума для железной дороги с шумоподавляющим экраном, выставленном на некотором расстоянии от полотна).</p>
<p>Понятие <span class="bolditalic">смежности</span> важно, например, в процедурах группирования, кластеризации и районирования. Определяя условия граничности (т.е., выставляя условие, что полигоны принадлежащие к одному класс должны иметь общее ребро и\или угол) мы можем формировать так называемые индивидуальные районы. Отказываясь от этих условий, мы получим результат, который ближе к типологическому районированию, когда отдельный район, принадлежащий к тому или иному типу, может быть представлен единственным изолированным полигоном. Следует иметь ввиду, что условия смежности неплохо "работают" в сценах с приблизительно равновеликими полигонами (например - городскими кварталами), но если перед нами очень разные по площади сущности (скажем, лесные массивы разной размерности, или страны разной величины), то необходимы более сложные способы.</p>
<p>Итак, то, каким именно образом мы концептуализируем (трактуем, интерпретируем) пространство в значительной степени определяет корректность и содержательность любого ГИС-моделирования. В одном из ранних (но отнюдь не устаревших!) изданий, посвященных философии и методологии ГИС-моделирования <b>С.Опеншоу</b> и <b>Г. Кларк</b> описывают (с изрядной долей юмора) следующую коллизию. <i>"Различия отражают дифференциацию в изучаемом явлении, а также в выборе регионов исследования и способов возможного взаимодействия между ними - последствия этих обстоятельств казалось бы очевидны, тем не менее, их часто полностью игнорируют. Например, если вы хотите выявить распределение пабов в Лидсе по статистике "ближайшего соседства", то результаты зависят от определения границ Лидса и выбранного ареала. На севере это может быть пространственно равномерное (дисперсное) распределение, на юге оно может оказаться случайным, а в центре города - кластерным, причем в каждом ареале будут свои причины именно такого распределения. Результат же для всего Лидса усредняет все эти различия и почти наверняка будет бессмысленным..."</i> <a href="BIBLIO.html#Openshaw_Clark_2005">[Openshaw, Clark, 2005, p.31]</a> Эффект такого рода моделей авторы номинировали как <span class="bolditalic">Statistical geographic hangovers|Похмелье геопространственной статистики</span>. Чтобы не страдать от последствий подобного "похмелья" необходимо ясно и четко, еще до этапа моделирования, представить характер исследуемого пространства.</p>
<br>
<footer id="main-footer">Пространственный анализ в геоэкологии © Е.Ю.Колбовский, 2022 </footer>
</body>
</html>