пятница, 31 октября 2014 г.

Что влияет на что

Иногда положение слова в предложении определяет его смысловое содержание.

Pete liked Jess. Jess didn't like Pete.
Jess liked Pete. Pete didn't like Jess.

Проблем нет, когда перед нами экскаватор и яма. Понятно, что экскаватор копает яму, а не наоборот.

Когда источником воздействия могут по смыслу быть оба предмета и они отвечают на один вопрос, текст становится запутанным.

like who: jess who: pete
not like who: jess who: pete

Решением может прийти из театра. Вот на сцене два персонажа. Один доволен таким соседством, а другой нет.

live who: pete where: here
live who: jess where: here
be happy who: pete
be unhappy who: jess


P.S.

Пример приведён не очень удачный, поскольку в английском для одушествлённых предметов есть вопросительное слово - whom.

Без окончаний

Когда смысловае ввязи названы явно отпадает надобность в использовании окончаний.

приходить кто: босяки куда: в деревня когда: в праздники

О минусах скажут другие, перечислю плюсы.

1. Любой естесственный язык может быть преобразован к такому виду без утраты смысла. Люди переходят на такой режим передачи сообщений при плохом качестве канала связи.

- В праздники босяки придут в деревню.
- Кто придёт?
- Босяки.
- Тусяки?
- Нет, не тусяки. Босяки.
- Косяки? Ты чё?
- Босяк. Босяки. Босые люди. Без обуви.

Общение туристов с местным населением на незнакомом языке тоже может проходить в подобном формате. Турист может произнести глагол, а на прочие составляющие просто указать пальцем.

Т.е. данный алгоритм применим к любому языку. Сообщение звучит станновато, но его смысл носители языка понимают полностью.

put who: gentleman what: paper where: on lap

2. Пропадает необходимость в программе анализировать формы слов. В существующих языках масса правил и ислючений. Врятли кто-либо когда-либо сможет формализировать все правила для всех языков в виде программного кода.

четверг, 30 октября 2014 г.

А.П. Чехов. Новая дача


Попытаюсь преобразовать начало рассказа А.П. Чехова "Новая дача" в объектно-ориентированный формат.

   В трех верстах от деревни Обручановой строился громадный мост. Из деревни, стоявшей высоко на крутом берегу, был виден его решётчатый остов, и в туманную погоду и в тихие зимние дни, когда его тонкие железные стропила и все леса кругом были покрыты инеем, он представлял живописную и даже фантастическую картину. Через деревню проезжал иногда на беговых дрожках или в коляске инженер Кучеров, строитель моста, полный, плечистый, бородатый мужчина в мягкой, помятой фуражке; иногда в праздники приходили босяки, работавшие на мосту; они просили милостыню, смеялись над бабами и, случалось, уносили что-нибудь. Но это бывало редко; обыкновенно же дни проходили тихо и спокойно, как будто постройки не было вовсе, и только по вечерам, когда около моста светились костры, ветер слабо доносил песню босяков. И днем иногда слышался печальный металлический звук: дон... дон... дон...

Начали!
 
На сцене появляется деревня.
Деревня называется Обручановая.
На сцене появляется мост.
Мост строился в трёхстах километрах от деревни.
Мост строился громадный.
На сцене появляется берег.
Берег был крутой.
Деревня стояла на берегу.
Деревня была высоко.
На сцене появляется остов.
Остов был у моста.
Остов был решётчатый.
Остов был виден из деревни.
На сцене появляется погода.
Погода была туманная.
На сцене появляются дни.
Дни были зимние и тихие.
На сцене появляются стропила.
Стропила были у моста.
Стропила были тонкие.
Стропила были железные.
На сцене появляются леса.
Леса были кругом.
На сцене появляется иней.
Стропила и леса были покрыты инеем.
На сцене появляется картина.
Картина была живописная и даже фантастическая.
Мост представлял собой картину.
На сцене появляются дрожки.
Дрожки были беговые.
На сцене появляется коляска.
На сцене появляется инженер.
Инженера звали Кучеров.
Инженер проезжал иногда через деревню на дрожках или в коляске.
Инженер был строителем моста.
Инженер был полный плечистый бородатый мужчина.
На сцене появляется фуражка.
Фуражка была помятая.
Инженер был в фуражке.
Со сцены уходит погода.
Со сцены уходят дни.
Со сцены уходят дрожки.
Со сцены уходит коляска.
Со сцены уходит инженер.
Со сцены уходит фуражка.
На сцене появляются праздники.
На сцене появляются босяки.
В празники босяки приходили в деревню.
Босяки работали на мосту.
На сцене появляется милостыня.
Босяки просили милостыню.
На сцене появляются бабы.
Босяки смеялись над бабами.
Босяки иногда уносили что-нибудь.
Босяки смеялись редко.
Босяки уносили редко.
Со сцены уходят праздники.
Со сцены уходят босяки.
Со сцены уходит милостыня.
Со сцены уходят бабы.
На сцене появляются дни.
Дни проходили обыкновенно тихо и спокойно.
На сцене появляется постройка.
Выполнялась постройка моста.
Постройки как будто не было вовсе.
Со сцены уходят дни.
На сцене появляются вечера.
На сцене появляются костры.
Костры светились около моста по вечерам.
На сцене появляется ветер.
На сцене появляется песня.
На сцену возвращаются босяки.
Ветер слабо доносил песню босяков.
Со сцены уходят вечера.
Со сцены уходят костры.
Со сцены уходит ветер.
Со сцены уходит песня.
На сцене появляется день.
На сцене появляется звук.
Днём иногда слышался печальный металлический звук.
Звук был дон... дон... дон...

Занавес!

В таком представлении информации у одного предмета одно название. Здесь нет местоимений. Появление и уход объектов со сцены объявлены, что позволяет простым способом разложить предложения на части. Важно явно выделить глагол, поскольку он несёт сведения об изменении. Здесь глагол подчёркнут, но можно было бы его ставить везде на первое место. Немцы, например, ставят значимую часть сказуемого в конец предложения. Это им не мешает общаться.

Сложные предложения отсутствуют. В песне поётся так. "Жираф большой. Ему виднее." Мы нормально понимаем это как то, что жирафу виднее, потому что он большой. Это феномен заслуживает отдельного изучения.

Есть некоторые сложности со словом "это", которое относится к целому отрывку. В нашем случае, затруднение вызвало слово "постройка".

Вместо фразы "на сцене появляется" можно было бы ставить плюс, а вместо фразы "со сцены уходит" знак минус, сократив тем самым трудозатраты на написание текста. Вместо фразы "на сцену возвращаются" пока не ясно, какой знак подошёл бы лучше всего.

Цель компьютерной обработки - преобразовать этот текст в сеть связанных узлов (граф).

Интересно отметить, что в ходе переработки исходного материала повествование было разбито на отдельные части (эпизоды) в тех местах, где сразу много предметов уходит со сцены.

Особый случай составляют объекты, которые уходят со сцены, а потом через некоторое время возвращаются на неё. Такие объекты участвуют в нескольких эпизодах. Они заслуживают особого анализа. Их можно использовать в качестве смысловых меток при описании смысла теста.

Интересны также объекты, которые долго остаются на сцене, и те объекты, которые имеют много связей.

Иными словами, можно кратко охарактеризовать данный фрагмент как текст об инженере и босяках в деревне.

+деревня
Называется деревня Обручановая.
+мост
Строился мост в трёхстах километрах от деревни.
Строился мост громадный.
+берег
Был берег крутой.
Стояла деревня на берегу.
Была деревня высоко.
+остов
Был остов у моста.
Был остов решётчатый.
Был остов виден из деревни.
+погода
Была погода туманная.
+дни
Были дни зимние и тихие.
+стропила
Были стропила у моста.
Были стропила тонкие.
Были стропила железные.
+леса
Были леса кругом.
+иней
Были покрыты инеем стропила и леса.
+картина
Была картина живописная и даже фантастическая.
Представлял собой мост картину.
+дрожки
Были дрожки беговые.
+коляска,инженер
Звали инженера Кучеров.
Проезжал инженер иногда через деревню на дрожках или в коляске.
Был инженер строителем моста.
Был инженер полный плечистый бородатый мужчина.
+фуражка
Была фуражка помятая.
Был инженер в фуражке.
-погода,дни,дрожки,коляска,инженер,фуражка
+праздники,босяки
Приходили босяки в деревню в праздники.
Работали босяки на мосту.
+милостыня
Просили босяки милостыню.
+бабы
Смеялись босяки над бабами.
Уносили босяки иногда что-нибудь.
Смеялись босяки редко.
Уносили босяки редко.
-праздники,босяки,милостыня,бабы
+дни
Проходили дни обыкновенно тихо и спокойно.
+постройка
Выполнялась постройка моста.
Не было постройки как будто вовсе.
-дни
+вечера,костры
Светились костры около моста по вечерам.
+ветер,песня
=босяки
Доносил ветер слабо песню босяков.
-вечера,костры,ветер,песня
+день,звук
Слышался днём иногда печальный металлический звук.
Был звук дон... дон... дон...

Эта запись напоминает такой стиль устного сообщения:

Мост. Какой был мост!
А деревня. Вы помните, какая была деревня?
Ну а инженер? Инженер был что надо.
Вот только босяки. Босяки воровали.
Какие были дни!

Есть мысли по поводу редактора для такого рода записи. Скажем у вас есть сенсорный экран. Вы напечатали небольшой фрагмент повествования. Затем жестами выкидываете слова из текста. Задача редактора - найти неопределённую форму выброшенного слова и ввести предмет на сцену его в нужном месте выше по тексту.

Можно вести и звуковую запись. Новое слово - новое прикосновение к экрану. На этом месте появляется значок. Если коснуться его ещё раз, слово будет воспроизведено через динамик. Значки можно выкидывать жестами с экрана. Мне кажется, что такая запись будет быстрее печати на клавиатуре. Структура создаваемого графа может быть использована, как вспомогательное средство при переводе голоса в текст.

Communicate with computers effectively

To interact with the computer world effectivly the humanity has to learn speaking a different langage. I think it is improbable that someone creates a computer program or a semantic model that allows the computer to deal with human knowledge in an effective way. We must collectively create a base of well structured texts. Only having this resource at its disposal the computer can analyse existing poorly structured texts. There is no way around. But business still hopes or tries to be happy with the technologies of yesterday. I think the language must be like a script for a play describing actors and things that come to the stage, perform some act and afterwards leave the stage.

суббота, 25 октября 2014 г.

Семантический JSON


Текст с обратной ссылкой

[
    {
        сижу: {
            кто: я,
            где: {
                на стуле: {
                    где: перед компьютером
                }
            }
        }
    },
    {
        работает: {
            что: {
                компьютер: {
                    сижу: {
                        где: {
                            на стуле: {
                                где: ?
                        }
                    }
                }
            }
        }
    }
]



Вопрос


[{
    сижу: {
        кто: я,
        где: ?
    }
}]


Вопрос о действии

[{
    ?: {
        что: компьютер
    }
}]



Правила

Перечисления заключаются в прямоугольные скобки

Блоки заключаются в фигурные скобки

Сообщение состоит из перечисления действий

Действие заключено в фигурные скобки (является блоком)

У действия только один ключ - сказуемое

К ключу действия относится блок уточняющей информации

Блок уточняющей информации может быть пуст

Ключами в блоке уточняющей информации являются вопросительные слова - кто, что, когда, как, почему, зачем и др.

Ключу в блоке уточняющей информации может быть сопоставлено:
- слово
- блок
- перечисление слов и блоков

Если ключу в блоке уточняющей информации сопоставлен блок или перечисление блоков, каждый из которых имеет единственный ключ-действие, то речь идёт о подчинённых предложениях

Если ключу в блоке уточняющей информации сопоставлен блок, ключ которого не является действием, то речь идёт о сложном уточнении

В сложном уточнении есть только один ключ, который отвечает на соответствующий вопрос

В сложном уточнении за ключом следует либо вложенный блок уточнений, либо обратная ссылка

Отличительные черты обратной ссылки:
- ключом является сказуемое
- сопоставлена ключу, который не является вопросительным словом
- содержит вопросительный знак, который стоит на месте другого названия этого же предмета выше по тексту
- является полной или урезанной копией одного из действий выше по тексту

Другие мысли здесь и прототип здесь.