Основная теорема анализа. Основная теорема функционального анализа Основная теорема анализа
Понятие об интегрировании, и в некоторой мере о дифференцировании, было хорошо развито раньше работ Ньютона и Лейбница. Но было совершенно необходимо сделать одно очень простое открытие, для того чтобы дать толчок к огромной эволюции вновь созданного математического анализа. Два как будто бы взаимно не соприкасающихся предельных процесса, употребляемые ©дин для дифференцирования, другой для интегрирования функций, оказались тесно связанными между собой. В самом деле, они являются взаимно обратными операциями, подобно таким операциям, как сложение и вычитание, умножение и деление. Дифференциальное и интегральное исчисления представляют собой нечто единое.
Великое достижение Ньютона и Лейбница заключается в том, что они впервые ясно осознали и использовали эту основную теорему анализа. Без сомнения, их открытие лежало на прямом пути естественного научного развития, и нисколько не удивительно, что различные лица пришли независимо и почти одновременно к ясному пониманию указанного выше обстоятельства.
Для того чтобы точно сформулировать основную теорему, рассмотрим интеграл от функции y = f (х) в пределах от постоянного числа а до числа х, которое будем считать переменным. Чтобы не смешивать верхнего предела интегрирования х с переменной, фигурирующей под знаком интеграла, запишем интеграл в следующем виде (см. стр. 435):
демонстрируя таким образом наше намерение изучать интеграл как функцию F (х) своего верхнего предела (рис. 274). Эта функция F (х) есть площадь под кривой y = f (u) от точки u = а до точки u = х . Иногда интеграл F (х) с переменным верхним пределом называют "неопределенным интегралом".
Основная теорема анализа читается следующим образом: Производная неопределенного интеграла (1) по его верхнему пределу х равна значению функции f (u) в точке u = х:
F" (х) = f (x).
Другими словами, процесс интегрирования, ведущий от функции f(x) к функции F (x), "уничтожается" обратным ему процессом дифференцирования, применяемым к функции F (х).
На интуитивной основе доказательство этого предложения не представляет труда. Оно базируется на интерпретации интеграла F (х) как площади, и было бы затемнено, если бы мы попытались представлять функцию F (х) в виде графика и истолковывать производную F" (х) как соответствующий наклон. Оставляя в стороне установленную ранее геометрическую интерпретацию производной, мы сохраним геометрическое толкование интеграла F (х) как площади, а дифференцировать функцию F (х) станем аналитическим методом. Разность
F (х 1) - F (х)
есть просто площадь под кривой y = f (u) между пределами u = х 1 и u = х (рис. 275), и нетрудно понять что числовое значение этой площади заключено между числами (х 1 - х)m и (x 1 - х) М:
(x 1 - x)m≤F (х 1) - F (х) ≤(х 1 - х) М,
где М и m являются соответственно наибольшим и наименьшим значениями функции f (u) в промежутке от u = х до u = x 1 . Действительно, эти произведения дают площади двух прямоугольников, из которых один содержит рассматриваемую криволинейную область, а другой содержится в ней.
Отсюда следует:
Предположим, что функция f (u) непрерывна, так что при стремлении x 1 к х обе величины М и m стремятся к значению функции f (u) в точке u = х, т. е. к значению f (х). В таком случае можно считать доказанным, что
Интуитивный смысл этого результата заключается в том, что при возрастании скорость изменения площади под кривой y = f (х) равна высоте кривой в точке х.
В некоторых руководствах содержание этой основной теоремы затемняется неудачно выбранной терминологией. Именно, многие авторы сначала вводят понятие производной, а затем определяют "неопределенный интеграл" просто как результат операции, обратной по отношению к дифференцированию: они говорят, что функция G (х) есть неопределенный интеграл от функции f (х), если
G" (х) = f(x).
Таким образом, этот способ изложения непосредственно связывает дифференцирование со словом "интеграл". Только позднее вводится понятие "определенный интеграл", трактуемое как площадь или как предел последовательности сумм, причем недостаточно подчеркивается, что слово "интеграл" обозначает теперь нечто совершенно другое, чем прежде. И вот оказывается, что самое главное, что содержится в теории, приобретается лишь украдкой с черного хода, и учащийся встречается с серьезными затруднениями в своих усилиях понять существо дела. Мы предпочитаем функции G (х), для которых G" (х) = f (х) , называть не "неопределенными интегралами", а первообразными функциями от функции f (х). Тогда основная теорема может быть сформулирована следующим образом:
Функция F (х), являющаяся интегралом от функции f (x) при постоянном нижнем и переменном верхнем пределе х, есть одна из первообразных функций от функции f (x).
Мы говорим "одна из" первообразных функций по той причине, что если G (х) является первообразной функцией от f (х), то непосредственно ясно, что и любая функция вида Н (х) = G (х) + с (с - произвольная постоянная) есть также первообразная, так как Н" (х) = G" (х) . Обратное утверждение также справедливо. Две первообразные функции G (х) и Н (х) могут отличаться одна от другой не иначе, как постоянным слагаемым. Действительно, разность U (х) = G (х) - Н (х) имеет в качестве производной U" (х) = G" (х) - Н" (х) = f (х) - f (х) = 0 , т. е. эта разность постоянна, так как очевидно, что если график функции в каждой своей точке горизонтален, то сама функция, представляемая графиком, непременно должна, быть постоянной.
Первым этапом путевого анализа является идентификация уравнений системы.
В современной эконометрической литературе идентификация понимается как структурная спецификация модели, призванная не только определить значения параметров, но и выделить одну-единственную итоговую структурную модель анализируемых данных.
Проблема идентифицируемости в системе структурных уравнений связана с наличием достаточного числа ограничений, накладываемых на него моделью. Применительно к p-анализу - это проблема соответствия между количеством возможных соотношений между r ij и p ij и числом p ij .
Иначе говоря, проблема идентифицируемости структурных параметров -- это проблема достаточности эмпирических данных для оценки всех коэффициентов модели. Необходимым условием идентифицируемости уравнения является отсутствие среди линейных комбинаций оставшихся уравнений, таких, которые удовлетворяли бы всем ограничениям модели, накладываемым на исследуемое уравнение.
Это эквивалентно так называемому условию порядка: для того чтобы уравнение в системе из т линейных структурных уравнений было идентифицируемо, необходимо, чтобы в нем отсутствовало по меньшей мере т -- 1 переменных из т + к переменных, встречающихся в модели. Обозначим через т число эндогенных переменных в модели, к -- число предопределенных переменных, h -- число эндогенных переменных в рассматриваемом уравнении, g -- число предопределенных переменных в рассматриваемом уравнении. Тогда условие порядка может быть записано в форме т+к -- h -- g > m -- 1 или к -- g > h -- 1.
Структурное уравнение называется идентифицируемым, если оно удовлетворяет условию порядка; в случае точного равенства уравнение называется точно идентифицируемым, при строгом неравенстве -- сверхидентифицируемым.
Следующим этапом является оценивание структурных параметров. Для структурных моделей, построенных на основе p-коэффициентов, оценка p ij производится не методом наименьших квадратов, а с помощью такого приема. Запишем уравнение (3) следующим образом: или иначе (9)
Используем коэффициенты корреляции между зависимой переменной и каждой из объясняющих переменных: (10)
где n- число наблюдений.
Подставляя в (10) вместо x i правую часть выражения (10), получим: (11)
В этом преобразовании учтено, что корреляция u i , с х j по определению равна нулю. Если учесть, что r ij =1, то соотношение (11), называемое основной теоремой путевого анализа, можно записать так: (12)
Здесь j указывает на объясняющую переменную, связь которой с объясняемой переменной i раскрывается в структурной модели, к пробегает по подмножеству всех переменных, непосредственно влияющих на i-ю переменную (на графе эти вершины связаны с вершиной i дугами). Соотношение (12) справедливо для любой рекурсивной системы.
Путевой анализ позволяет произвести декомпозицию корреляции r ij . Введем понятия «полная (совокупная) связь», «совокупное влияние», «прямое влияние», «косвенное влияние». Если коэффициент корреляции нулевого порядка r ij рассматривать как измеритель полной связи двух переменных, то мерой совокупного влияния j-й переменной на i-ю переменную (q ij) будет являться ее часть, не зависящая ни от общих для них переменных -- причин, ни от корреляции между общими для j-й и i-й переменных причинами (компоненты ложной корреляции), ни от наличия не анализируемой в модели априорной корреляции предопределенных переменных -- входов.
Таким образом, мы можем разложить полную связь двух переменных на четыре составляющие с учетом постулируемой в модели асимметрии воздействия: на совокупное влияние (причинное влияние) j-й переменной на i-ю, на две компоненты, измеряющие эффект ложной корреляции, и на компоненту, еще не имеющую общепринятого названия. В свою очередь, совокупное влияние может быть разложено на две составляющие с учетом того, каким образом оно осуществляется -- непосредственно или через другие переменные.
Прямое влияние одной переменной на другую измеряется коэффициентом p ij ; в этом случае в цепи между объясняющей и объясняемой переменными нет промежуточных звеньев. Косвенное влияние -- это влияние тех составляющих совокупного влияния одной переменной на другую, которое образуется при учете эффекта передачи воздействия через посредство переменных, специфицированных в модели как промежуточные звенья в причинной цепи, связывающей изучаемые переменные. Поскольку строение совокупного влияния всецело зависит от постулируемой причинной структуры отношений между переменными, то и все введенные выше понятия имеют смысл только лишь по отношению к причинной модели с заданным графом связей.
Как-то мы с отцом ехали вдвоём далеко на машине. А это хороший повод для умной беседы.
Речь зашла об «основных теоремах». Основная теорема арифметики - это что любое целое раскладывается на произведение простых чисел, и единственным образом. Основная теорема алгебры - это что у многочлена столько корней, какой он степени (хотя там с формулировками ад). А основная теорема анализа у меня как-то вылетела тогда из головы.
Отец предположил, что основная теорема анализа - это теорема Ньютона-Лейбница. «Это про что?» - спросил я. Отец: «Точную формулировку не помню, но что-то о том, что интегрирование - это операция, обратная дифференцированию».
Стоп, а это разве не по определению?
Как всегда с этими основными теоремами, сказанное в них кажется очевидным после того, как ты уже это прошёл. Но на самом деле именно основная теорема позволяет нам считать интегрирование и дифференцирование обратными операциями. Дальше пойдут глубоко антинаучные рассуждения, где любой математик найдёт 100500 формальных ошибок, но это сейчас не важно.
Что такое дифференцирование? Это когда мы в каждой точке функции проводим касательную и находим тангенс угла, под которым она проходит к горизонту, вот этого:
Теперь если каждой точке поставить в соответствие найденный тангенс, то получится новая функция, которая называется производной. Напомню, что число e , что производная функции e x равна e x , то есть в каждой точке тангенс угла как раз равен значению самой функции.
Что такое интегрирование? Это нахождение площади фигуры под кривой функции, ограниченной некими вертикальными границами a и b и горизонтальной осью:
Если делить на всё большее число прямоугольников и посмотреть предел суммы площадей, то получится как раз площадь этой фигуры. Эта площадь называется определённым интегралом функции y = f(x) на отрезке [a; b ] и обозначается вот так:
Прямо скажем, совсем не очевидно, что фигня про углы и фигня про площадь вообще как-то связаны.
А связаны они вот как. Обратная производной функция называется первообразной. Первообразная от f(x) - это такая функция g(x) , что её производная g´(x) = f(x) . Например, у функции y = x 2 + 8 производная y = 2x . Значит для функции y = x функция y = (x 2 / 2) + 4 является первообразной.
Легко заметить, что таких функций бесконечное множество. Например, производная функции y = x 2 + 28 это тоже y = 2x . Значит для функции y = x функция (x 2 / 2) + 14 тоже является является первообразной. Это логично, ведь производная - это угол в каждой точке, и естественно, что он не меняется от того, на какую высоту мы вертикально поднимаем весь график функции целиком. Значит для функции x первообразная - это x 2 / 2 плюс сколько угодно .
Так вот, оказывается, чтобы найти площадь фигуры под функцией y = f(x) в пределах от a до b , нужно взять значения любой из её первообразных g(x) в точках b и a и вычесть одно из другого:
Здесь g - хоть и любая, но всё-таки какая-то одна первообразная, поэтому «сколько угодно» у неё будут одинаковыми, вычтутся друг из друга и на результат не повлияют. Можете взять какую-нибудь простую функцию вроде y = 2x , где площадь и без интегралов легко посчитать в уме, и проверить. Работает!
Эта формула и называется основной теоремой анализа или теоремой Ньютона-Лейбница. Если её доказать, то можно уже называть нахождение первообразной интегрированием и вообще относиться к дифференцированию и интегрированию как к взаимно-обратным операциям.
ОСНОВНАЯ ТЕОРЕМА ФУНКЦИОНАЛЬНОГО АНАЛИЗА:
"... точно так же, как одно и то же явление может иметь многочисленные функции, так и одна и та же функция может по-разному выполняться различными явлениями" .
Иначе говоря, существует диапазон вариаций (хотя и ограниченный) структур, могущих выполнять ту или иную функцию.
"Таким образом... понятию незаменимых культурных форм (институтов, стандартизированной деятельности, систем убеждений и т. д.)... необходимо противопоставить> понятие функциональных альтернатив, функциональных эквивалентов или функциональных заменителей" .
Зв. Мертоновская стратегия функционального анализа (Кодификация функционального метода)
В процессе функционального анализа необходимо выделять:
(1) различные формы, подлежащие рассмотрению (системы и их части);
"... нельзя предполагать полную интеграцию всех обществ. Вопрос об интеграции общества - это вопрос эмпирического исследования, и, решая его, мы должны быть готовыми к тому, что общества обнаружат различные степени интеграции...
...Теория функционального анализа должна включать в себя требование спецификации той социальной единицы, которая обслуживается данной социальной функцией, равно как и признание того, что явления культуры имеют множество следствий..." ;
(2) различные типы влияний этих форм на эмпирически установленные "фун
кциональные предпосылки": как функциональные, так и дисфункциональные;
"определение чисто балансового итога последствий того или иного социального явления" ;
(3) процессы, благодаря которым именно эти, а не другие формы начинают су
ществовать и оказывать влияние друг на друга и на систему в целом
= "функциональные альтернативы".
Зг. Понятие "функция"
В работе "Явные и латентные функции" Мертон проанализировал применение понятия "функция" в работах функционалистов (социологов и социальных антропологов).
"С самого момента возникновения в функциональный метод в социологии проникла терминологическая путаница. Очень часто один и тот же термин используется для обозначения различных понятий, точно так же как одно и то же понятие обозначается различными терминами" .
Мертон выделяет пять значений понятия "функция" (существующих наряду со множеством других).
(1) Общественное мероприятие .
"Обиходное употребление, согласно которому функцией называют некоторое публичное собрание или праздничное мероприятие, обычно включающее какие-то церемониальные моменты" .
Это значение редко используется в социологии и "полностью чуждо функциональному анализу".
(В русском языке слово "функция" в данном значении не употребляется.)
(2) Специализированный род занятий, профессия .
Это значение часто используется экономистами для описания функционального распределения занятий в группе (распределения экономических функций).
Для социологии в данном случае лучше пользоваться термином "профессия" (или "род занятий").
(3) Должность .
<Частный случай второго значениям
"Деятельность, входящая в круг обязанностей человека, занимающего некоторое социальное положение, или, более конкретно.., круг обязанностей, связанных с некоторой должностью или политической позицией" .
// Отсюда слово "функционер".
Это понимание функции лучше исключить, "так как оно отвлекает наше понимание от того обстоятельства, что функции осуществляются не только лицами.., но и широким кругом стандартизированных деятельно-стей, социальных процессов, культурных стандартов и систем верований..." .
(4) Математическая функция .
"...Переменная, рассматриваемая в отношении к одной или большему числу других переменных, через которые она может быть выражена и от значения которых зависит ее собственное значение" .
// Выражения: "функциональная зависимость", "функциональное отношение"...
В социологии это значение используется,
однако "... исследователи... нередко мечутся между математическим и другим, связанным, хотя и отличным от него, значением, которое также включает в себя понятия взаимозависимости, взаимного отношения или же взаимосвязанных изменений" .
(5) Взаимозависимость, взаимная связь .
Системообразующий принцип связи структурных элементов.
"...Именно это пятое значение слова и является главным в функциональном анализе в том его виде, в котором он применяется в социологии и социальной антропологии" .
(Это значение заимствовано из биологии.) Функция описывалась как:
Роль в обществе;
Вклад в сохранение общества в целом; способ взаимосвязи элементов внутри системы.
Использование в качестве синонимов-эквивалентов таких понятий, как "применение", "полезность", "цель", "мотив", "намерение", "стремление", "следствие" и т. п., вносит путаницу в понятийный аппарат и, кроме того, часто ведет к смешению (субъективных) мотивов с (объективной) функцией.
Следовательно , в целях систематизации понятий функционального анализа необходимо четко разделить понятия мотивов и функций.
Мертон дает термину "функция" следующее ОПРЕДЕЛЕНИЕ:
"функции - это те наблюдаемые последствия, которые способствуют адаптации или приспособлению данной системы" .
Зд. Понятия "дисфункция" и "социологическая амбивалентность"
ОПРЕДЕЛЕНИЕ.
"Дисфункции - это те наблюдаемые последствия, которые уменьшают приспособление или адаптацию системы" .
Понятие "дисфункция" указывает на наличие напряжения, принуждения, давления на структурном уровне.
Позднее, продолжая свою линию на выявление как положительных, так и отрицательных последствий того или иного явления для системы, Мертон ввел понятие "социологическая амбивалентность". Суть этого понятия в том, что любая форма, выполняющая (или способная выполнять) позитивные функции в системе, способна играть (или играет) в ней также и дисфункциональную роль.
Зе. Явные и латентные функции (Работа "Явные и латентные функции", с.425-431)
ЦЕЛЬ ВВЕДЕНИЯ ДАННОГО РАЗГРАНИЧЕНИЯ -
исключить смешение сознательной (субъективной) мотивации социального поведения и его объективных последствий.
СУТЬ РАЗГРАНИЧЕНИЯ:
"разграничение между случаями, в которых субъективные цели совпадают с объективными последствиями, и случаями, когда они расходятся" . "В основе разграничения между явными и латентными функциями лежит следующее: первые относятся к тем объективным и преднамеренным последствиям социального действия, которые способствуют приспособлению или адаптации некоторой определенной социальной единицы (индивидуум, подгруппа, социальная или культурная система); вторые относятся к непреднамеренным и неосознанным последствиям того же самого порядка" .
ОПРЕДЕЛЕНИЕ.
"Явные функции - это те объективные последствия, которые вносят свой вклад в регулирование или приспособление системы и которые входили в намерения и осознавались участниками системы.
Латентные функции,
соответственно, - те объективные
последствия, которые не входили в намерения и не были
осознаны" .
________________________________
ЭВРИСТИЧЕСКИЕ ЦЕЛИ РАЗГРАНИЧЕНИЯ.
(1) "Это разграничение позволяет понять стандарты социального поведения,
которые на первый взгляд кажутся иррациональными" .
Например, предрассудки, суеверия, инертные традиции - это формы поведения, продолжающие существовать, в то время как их явные цели уже не осуществляются.
"Это поведение может выполнять функцию для группы, совершенно отличную от явной ее цели... *" Путем систематического применения понятия латентной функции иногда можно обнаружить, что явно иррациональное поведение является положительно функциональным для группы" .
(2) "Однако в тех случаях, когда социальное поведение не направляется на
достижение явно недосягаемых целей, исследование побочных или ла
тентных функций поведения социологами становится менее вероятным.
Различение между явными и латентными функциями направляет внимание на теоретически плодотворные области исследования" .
Вопрос : достигает ли принятая практика поставленной перед ней цели? (Особенно важны ответы на такого рода вопросы для практической политики.)
Изучение латентных функций наиболее многообещающе для теоретической социологии:
(3) оно позволяет избежать моральных оценок;
(4) оно делает социологию не просто регистрацией наблюдаемых и очевидных для здравого смысла данных; оно выводит ее за рамки обыденного сознания, для которого латентные функции социальных явлений (по определению) недоступны.
Зж. Парадигма для функционального анализа в социологии: 11 положений (Работа "Явные и латентные функции", с.412-425)
Социологии необходима общая "логика процедуры" для проведения исследования.
"В качестве первого опытного шага в направлении кодификации функционального анализа в социологии предлагается парадигма понятий и проблем, которые являются центральными для данного подхода.., «Эна> позволяет одновременно рассматривать основные требования функционального анализа и помогает исследователю вносить коррективы в выдвигаемые им интерпретации... Данная парадигма дает нам основное ядро понятий, методик и выводов функционального анализа" .
1. Явление (явления), которому приписывается функция .
Объект анализа должен представлять собой "стандартизированное (т. е. типизированное, повторяющееся) явление, такое, как социальные роли, ин-
ституционные типы, социальные процессы, культурные стандарты, эмоциональные реакции, выраженные в соответствии с нормами данной культуры, социальные нормы, групповые организации, социальные структуры, средства социального контроля и т. д." .
2. Субъективные предпосылки (мотивы, цели) -
"мотивы деятельности индивидов, включенных в исследуемую систему" (не путать с объективными последствиями мотиваций).
3. Объективные последствия (функции, дисфункции).
(1) Необходимость учета множественности последствий = требование под
ведения "чистого балансового итога совокупных последствий":
(а) функции;
(б) дисфункции;
(в) нефункциональные последствия, безразличные для сис
темы.
(2) Разграничение объективных функций и субъективных мотивов:
(а) явные функции;
(б) латентные функции.
4. Социальная единица, обслуживаемая функцией
.
Необходимо рассматривать последствия явления для:
Индивидов разного статуса;
Подгрупп;
Больших социальных и культурных систем.
5. Функциональные требования (потребности, предпосылки существования).
Проблема установления разных типов функциональных предпосылок (всеобщие versus специфические).
6. Механизмы, через которые выполняется функция
.
Социальные
(не психологические) механизмы:
Распределение ролей;
Иерархический порядок ценностей;
Обособление институциональных требований;
Социальное разделение труда;
Ритуалы, церемонии; и т. д.
7. Функциональные альтернативы (эквиваленты, заменители).
«Этказ от постулата функциональной неизбежности и незаменимости конкретных социальных структур>.
Проблема "определения диапазона изменчивости явлений, оставаясь в котором, они могут выполнять определенную функцию".
8. Структурный контекст (ограничивающее влияние структуры).
"Диапазон вариаций в явлениях, при которых они могут выполнять соответствующие функции в социальной структуре, не является беспредельным.
Взаимозависимость элементов социальной структуры ограничивает фактические возможности изменений или функциональных альтернатив" .
9. Динамика и изменение .
Необходимо исследовать как статические, так и динамические аспекты социальной структуры. (Особая роль изучения дисфункций.) Исследование факторов неравновесия.
10. Проблемы, связанные с установлением достоверности положений функ-
иионального анализа
.
(Требование строгих методик анализа; связь с практическими исследованиями.)
11. Проблемы идеологического значения функционального анализа .
Роль идеологии (влияние заказчика) в постановке проблем, формулировке гипотез, понятий, выводов;
Возможное идеологическое значение выводов.
§ 5. Основная теорема анализа
1. Основная теорема. Понятие об интегрировании, и в некоторой мере о дифференцировании, было хорошо развито раньше работ Ньютона и Лейбница. Но было совершенно необходимо сделать одно очень простое открытие, для того чтобы дать толчок к огромной эволюции вновь созданного математического анализа. Два как будто бы взаимно не соприкасающихся предельных процесса, употребляемые один для дифференцирования, другой для интегрирования функций, оказались тесно связанными между собой. В самом деле, они являются взаимно
обратными операциями, по- |
||||
добно таким операциям, как |
||||
сложение и вычитание, умно- |
||||
жение и деление. Дифферен- |
||||
циальное и интегральное ис- |
||||
числения представляют собой |
||||
нечто единое. |
||||
Великое достижение Нью- |
||||
тона и Лейбница заключается |
||||
в том, что они впервые яс- |
||||
Рис. 274. Интеграл как функция верхнего |
но осознали и использовали |
|||
эту основную теорему анали- |
||||
за. Без сомнения, их откры- |
тие лежало на прямом пути естес твенного научного развития, и нисколько не удивительно, что различ ные лица пришли независимо и почти одновременно к ясному пониманию указанного выше обстоятельства.
Для того чтобы точно сформулировать основную теорему, рассмотрим интеграл от функции y = f(x) в пределах от постоянного числа a до числа x, которое будем считать переменным. Чтобы не смешивать верхнего предела интегрирования x с переменной, фигурирующей под знаком интеграла, запишем интеграл в следующем виде (см. стр. 428 ):
F (x) = Z |
демонстрируя таким образом наше намерение изучать интеграл как функцию F (x) своего верхнего предела (рис. 274). Эта функция F (x) есть площадь под кривой y = f(u) от точки u = a до точки u = x. Иногда интеграл F (x) с переменным верхним пределом называют «неопределенным интегралом».
Основная теорема анализа читается следующим образом:
Производная неопределенного интеграла (1 ) по его верхнему пределу x равна значению функции f(u) в точке u = x:
F 0 (x) = f(x).
ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА |
Другими словами, процесс интегрирования, ведущий от функции f(x) к функции F (x), «уничтожается» обратным ему процессом дифференцирования, применяемым к функции F (x).
На интуитивной основе доказательство этого предложения не представляет труда. Оно базируется на интерпретации интеграла F (x) как площади, и было бы затемнено, если бы мы попытались представлять функцию F (x) в виде графика и истолковывать производную F 0 (x) как соответствующий наклон. Оставляя в стороне установленную ранее геометрическую интерпретацию производной, мы сохраним геометрическое толкование интеграла F (x) как площади, а дифференцировать функцию F (x) станем аналитическим методом. Разность
F (x1 ) − F (x)
есть просто площадь под кривой y = f(u) между пределами u = x1 и u = x (рис. 275), и нетрудно понять, что числовое значение этой площади заключено между числами (x1 − x)m и (x1 − x)M:
(x1 − x)m 6 F (x1 ) − F (x) 6 (x1 − x)M,
где M и m являются, соответственно, наибольшим и наименьшим значениями функции f(u) в промежутке от u = x до u = x1 . Действительно, эти произведения дают площади двух прямоугольников, из которых один содержит рассматриваемую криволинейную область, а другой содержится в ней.
Рис. 275. К доказательству основной теоремы
Отсюда следует
m 6 F (x1 ) − F (x) 6 M. x1 − x
Предположим, что функция f(u) непрерывна, так что при стремлении x1 к x обе величины M и m стремятся к значению функции f(u) в точке u = x, т. е. к значению f(x). В таком случае можно считать
468 МАТЕМАТИЧЕСКИЙ АНАЛИЗ гл. VIII
доказанным, что |
|||
F 0 (x) = lim |
F (x1 ) − F (x) |
||
x1 →x |
x1 − x |
Интуитивный смысл этого результата заключается в том, что при возрастании скорость изменения площади под кривой y = f(x) равна высоте кривой в точке x.
В некоторых руководствах содержание этой основной теоремы затемняется вследствие неудачно выбранной терминологии. Именно, многие авторы сначала вводят понятие производной, а затем определяют «неопределенный интеграл» просто как результат операции, обратной по отношению к дифференцированию: они говорят, что функция G(x) есть неопределенный интеграл от функции f(x), если
G0 (x) = f(x).
Таким образом, этот способ изложения непосредственно связывает дифференцирование со словом «интеграл». Только позднее вводится понятие «определенный интеграл», трактуемое как площадь или как предел последовательности сумм, причем недостаточно подчеркивается, что слово «интеграл» обозначает теперь нечто совершенно другое, чем прежде. И вот оказывается, что самое главное, что содержится в теории, приобретается лишь украдкой - через заднюю дверь, и учащийся встречается с серьезными затруднениями в своих усилиях понять существо дела. Мы предпочитаем функции G(x), для которых G0 (x) = f(x), называть не «неопределенными интегралами», а первообразными функциями от функции f(x). Тогда основная теорема может быть сформулирована следующим образом:
Функция F (x), являющаяся интегралом от функции f(x) при постоянном нижнем и переменном верхнем пределе x, есть одна из первообразных функций от функции f(x).
Мы говорим «одна из» первообразных функций по той причине, что если G(x) является первообразной функцией от f(x), то непосредственно ясно, что и любая функция вида H(x) = G(x) + c (c - произвольная постоянная) есть также первообразная, так как H0 (x) = G0 (x). Обратное утверждение также справедливо. Две первообразные функции G(x)
и H(x) могут отличаться одна от другой не иначе, как постоянным слагаемым. Действительно, разность U(x) = G(x) − H(x) имеет в качестве производной U0 (x) = G0 (x) − H0 (x) = f(x) − f(x) = 0, т. е. эта разность постоянна, так как очевидно, что если график функции в каждой своей точке горизонтален, то сама функция, представляемая графиком, непременно должна быть постоянной.
Это ведет к очень важному правилу вычисления интеграла в пределах от a до b - в предположении, что нам известна какая-либо первообразная функция G(x) от функции f(x). Согласно нашей основной
ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА |
теореме, функция
есть также первообразная функция от функции f(x). Значит, F (x) =
G(x) + c, где c - постоянная. Значение этой постоянной определится,
если мы примем во внимание, что F (a) = f(u) du = 0. Отсюда следует:
0 = G(a) + c, так что c = −G(a). Тогда определенный интеграл в пределах от a до x тождественно удовлетворяет равенству
F (x) = f(u) du = G(x) − G(a);
замена x через b приводит к формуле
f(u) du = G(b) − G(a), |
независимо от того, какая именно из первообразных функций была «пущена в ход». Другими словами: чтобы вычислить определенный ин-
теграл f(x) dx, достаточно найти такую функцию G(x), для кото-
рой G0 (x) = f(x), и затем составить разность G(b) − G(a).
2. Первые применения. Интегрирование функций xr , cos x, sin x. Функция arctg x. Здесь невозможно дать исчерпывающее представление о роли основной теоремы, и мы ограничимся тем, что приведем несколько выразительных примеров. В задачах, встречающихся в механике и физике или в самой математике, очень часто приходится подсчитывать числовое значение некоторого определенного интеграла. Прямая попытка найти интеграл как предел может быть непреодолимо трудной. С другой же стороны, как мы это видели в § 3, любое дифференцирование выполняется сравнительно легко, и без труда возможно накопить очень большое количество формул дифференцирования. Каждая такая формула G0 (x) = f(x), обратно, может быть рассматриваема как формула, определяющая первообразную функцию G(x) от функции f(x).
Формула (3 ) позволяет использовать известную первообразную функцию для вычисления интеграла от функции f(x) в некотором данном промежутке.
Если мы, например, хотим найти интегралы от степеней x2 , x3 , или в общем виде xn , то самое простое - это действовать, как указано в § 1. По формуле дифференцирования степени производная от xn равна nxn−1 ,
470 МАТЕМАТИЧЕСКИЙ АНАЛИЗ гл. VIII
так что производная от функции
G(x) = n x |
|
1 (n 6= −1) |
есть функция
G0 (x) = n n + + 1 1 xn = xn .
x n+1
В таком случае функция n + 1 является первообразной функцией
по отношению к функции f(x) = xn , а следовательно, мы немедленно получаем формулу
x n dx = G(b) − G(a) = b n+1 − a n+1 . n + 1
Это рассуждение несравненно проще громоздкой процедуры непосредственного вычисления интеграла как предела суммы.
Как более общий случай, мы нашли в § 3, что при любом рациональном s, как положительном, так и отрицательном, производная функции xs равна sxs−1 , а потому при s = r + 1 функция
x r+1
имеет производную f(x) = G0 (x) = xr (мы предполагаем, что r 6= −1,
x r+1
т. е. что s 6= 0). Итак, функция r + 1 есть первообразная функция, или
«неопределенный интеграл» от xr , и мы получаем (при положительных a и b и при r 6= −1) формулу
xr dx = |
b r+1 − a r+1 |
||
В формуле (4 ) приходится предполагать, что стоящая под интегралом функция xr определена и непрерывна в промежутке интегрирования, так что нужно исключить точку x = 0, если r < 0. Вот потому мы и вынуждены допустить, что в этом случае a и b положительны.
Если положим G(x) = − cos x, то получим G0 (x) = sin x, и отсюда возникает соотношение
sin xdx = −(cos a − cos 0) = 1 − cos a.
Аналогично, если G(x) = sin x, то G0 (x) = cos x, и значит,
cos xdx = sin a − sin 0 = sin a.
§ 5 ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА 471
Особенно интересный результат получается из формулы дифференцирования функции arctg x:
Раз функция arctg x есть первообразная по отношению к функции |
||||||||
1 + x2 |
||||||||
то на основании формулы (3 ) можно написать
arctg b − arctg 0 = Z 0 |
1 + x2 dx. |
|
Но arctg 0 = 0 (нулевому значению тангенса соответствует нулевое значение угла). Итак, мы имеем
arctg b = Z 0 |
|||||||||||||
1 + x2 |
|||||||||||||
В частности, |
значению |
тангенса, |
|||||||||||
1, соответствует |
|||||||||||||
в 45◦ , что в радианной мере со- |
|||||||||||||
ставляет p . Таким образом, мы |
|||||||||||||
получаем |
|||||||||||||
замечательную |
|||||||||||||
1 + x2 dx. |
|||||||||||||
показывает, |
что площадь |
||||||||||||
графиком |
|||||||||||||
1 + x 2 в пределах от x = 0 до x = |
|||||||||||||
1 равна четверти площади еди- |
276. Площадь под кри- |
||||||||||||
ничного круга. |
|||||||||||||
в пределах |
|||||||||||||
3. Формула |
Лейбница |
1 + x2 |
|||||||||||
приводит |
|||||||||||||
для p . Последний результат |
из красивейших |
||||||||||||
математических формул, открытых в XVII в., - к знакоп еременному |
|||||||||||||
ряду Лейбница, позволяющему вычислять p: |
|||||||||||||
4 p = 1 1 − 3 1 + 5 1 − 7 1 + 9 1 − 11 1 + . . . |
Символ + . . . следует понимать в том смысле, что последовательность конечных «частных сумм», получающихся, когда в правой части ра-
венств берется лишь n членов суммы, стремится к пределу p при
неограниченном возрастании n.
МАТЕМАТИЧЕСКИЙ АНАЛИЗ |
Чтобы доказать эту замечательную формулу, нам достаточно вспомнить формулу суммы конечной геометрической прогрессии
1 − q n = 1 + q + q2 + . . . + qn−1 ,
где «остаточный член» Rn выражается формулой
Rn = (−1)n x 2n 2 .
Равенство (8 ) можно проинтегрировать в пределах от 0 до 1. Следуя правилу a) из § 3, мы должны взять в правой части сумму интегралов от отдельных слагаемых. На основании (4 ) мы знаем, что
xm dx = |
b m+1 |
− am+1 |
|||||||||||||||||||||||||||||||||||
частности, получим |
xm dx = |
||||||||||||||||||||||||||||||||||||
откуда, в |
1 + x2 |
1 − 3 + |
А следовательно, |
||||||||||||||||||||||||||||||||||
− 7 |
+ . . . + (−1)n−1 |
2n − 1 + T n , |
|||||||||||||||||||||||||||||||||||
p · R 0 |
1 + x2 |
||||||||||||||||||||||||||||||||||||
Tn = ( |
Согласно формуле (5 ), левая часть форму- |
||||||||||||||||||||||||||||||||||||
лы (9 ) равна |
Разность между |
и частной суммой |
|||||||||||||||||||||||||||||||||||
(−1)n−1 |
|||||||||||||||||||||||||||||||||||||
Sn = 1 − |
|||||||||||||||||||||||||||||||||||||
− Sn = Tn . Остается доказать, что Tn стремится к нулю при |
|||||||||||||||||||||||||||||||||||||
возрастании n. Мы имеем неравенство
x 2n 6 x2n .
1 + x2
Вспомнив формулу (13 ) § 1, устанавливающую неравенство
f(x) dx 6 g(x) dx при f(x) 6 g(x) и a < b,