Поддержка JPEG в dlib

Коллекция библиотек dlib обзавелась начальной поддержкой декодирования формата JPEG (dlib.image.io.jpeg). Пока поддерживается только baseline-часть стандарта, декодер читает только изображения с прореживанием 4:2:0 и не загружает метаданные EXIF (эти ограничения постепенно будут исправлены). Как и другие декодеры графических форматов в dlib, модуль работает на основе абстрактных потоков ввода/вывода (dlib.core.stream).
Поддержка сохранения в JPEG в ближайшем будущем не планируется.

Поддержка IQM в DGL

Графический движок DGL обзавелся поддержкой Inter-Quake Model (IQM) – свободного формата для хранения 3D-моделей со скелетной анимацией.

IQM спроектирован в качестве замены MD5 известным разработчиком Ли Сальцманом, лидером проектов Sauerbraten, Tesseract и ENet. В настоящее время формат используется многими свободными играми и движками, в том числе Sauerbraten, DarkPlaces, Alien Arena, Xonotic и Warsow.

Формат бинарный, не привязан к какому-либо движку или графической технологии, легко читается и записывается. Существует полнофункциональный экспортер в IQM для Blender, что делает этот формат идеальным выбором для открытых игровых проектов.

Провайдеры блокируют GitHub

Это происходит уже не в первый раз, но теперь коснулось и меня: по требованию Роскомнадзора МТС заблокировали доступ к крупнейшему OpenSource-хостингу GitHub. Вчера сайт снова оказался в списке запрещенных ресурсов за размещение файла с описанием способов самоубийства (скорее всего, данный типовой текст размещается недоброжелателями с провокационной целью).
Так как GitHub доступен только по HTTPS, блокировка отдельных страниц невозможна, и провайдеры закрывают доступ к сайту целиком. Уже известно, что GitHub блокируется многими крупными российскими провайдерами, включая Билайн и Ростелеком.
При этом GitHub проигноировали предписание по удалению “проблемных” файлов, и Роскомнадзор в ближайшее время не намерен снимать блокировку.
Я до последнего хотел воздерживаться от негативных комментариев по поводу сомнительной деятельности наших чиновников, но теперь молчать уже попросту нельзя! Интересно, понимают ли глубокоуважаемые господа цензоры, что GitHub сегодня является важной частью различных отраслей бизнеса, науки и образования?
И ладно бы еще от этого страдали энтузиасты-любители вроде меня – нас не жаль, понятно, но как же коммерческие организации, университеты? Разработчики ключевых открытых проектов, которые используются в том числе и госорганами?
Демонстрируя подобную недальновидность и узколобость, власти своими же руками уничтожают всякие остатки репутации нашей страны за рубежом, не говоря уже о доверии со стороны собственных граждан.

Chroma Key с использованием dlib

Эффект Chroma Key (“цветовой ключ”) заключается в сегментации изображения с тем, чтобы отделить объект переднего плана от фона. При этом цвет фона должен быть сплошным и равномерным – как правило, выбирают либо зеленый, либо синий, в зависимости от того, какой цвет отсутствует на объекте. Отделенное изображение затем накладывается на другой фон – например, на фотографию или рендер виртуальной сцены.

Существуют различные алгоритмы подобной сегментации, мы рассмотрим один из самых простых. Несмотря на простоту, он достаточно эффективен. Метод основан на нахождении евклидового расстояния в пространстве RGB – между цветом исходного пикселя и цветом фона. Если рассматривать цвета как точки в трехмерном пространстве, то пиксели, например, зеленого фона будут представлять собой облако точек, сосредоточенное вокруг “абсолютно зеленой” точки – (0, 1, 0). Чтобы получить значение альфа-канала (0 – пиксель принадлежит фону, 1 – не принадлежит), мы просто нормируем расстояние в заранее выбранном диапазоне.

import dlib.math.vector;
import dlib.math.utils;
import dlib.image.image;
import dlib.image.color;

SuperImage chromaKey(
    SuperImage img, 
    Color4f keyColor, 
    float minDist,
    float maxDist)
{
    auto res = new ImageRGBA8(img.width, img.height);
   
    foreach(y; img.col)
    foreach(x; img.row)
    {       
        Color4f col = img[x, y];
        
        Color4f delta = col - keyColor;
        float distSqr = dot(delta, delta);
        col.a = clamp(
            (distSqr - minDist) / (maxDist - minDist), 
            0.0f, 1.0f);
        res[x, y] = col;
    }
    
    return res;
}

Вот пример использования этой функции:

import dlib.image.io.io;

auto img = load("input.png");
auto res = img.chromaKey(Color4f(0, 1, 0), 0.3f, 0.7f);
res.save("output.png");

Как нетрудно заметить, результат не идеален – если наложить изображение на фон, вокруг актера наблюдается зеленоватый контур. От него можно избавиться путем эрозии альфа-канала: изображение пропускается через дискретный оконный фильтр 3х3, который присваивает пикселю наименьшее значение в окне. В результате, непрозрачная область “теряет” несколько пикселей контура, и зеленый ореол практически исчезает.

SuperImage erodeAlpha(SuperImage img)
{
    uint kw = 3, kh = 3;
    
    auto res = img.dup;
    
    foreach(y; img.col)
    foreach(x; img.row)
    {
        auto c = img[x, y];
        
        foreach(ky; 0..kh)
        foreach(kx; 0..kw)
        {
            int iy = y + (ky - kh/2);
            int ix = x + (kx - kw/2);

            if (ix < 0) ix = 0;
            if (ix >= img.width) ix = img.width - 1;
            if (iy < 0) iy = 0;
            if (iy >= img.height) iy = img.height - 1;
            
            float a = img[ix, iy].a;
            
            if (a < c.a) 
                c.a = a;
        }

        res[x, y] = c;
    }
    
    return res;
}

Кинематика персонажа

Доступна новая демонстрация работы dmech – на этот раз, на примере игровой кинематики (Character Controller) для игры от третьего лица. Персонаж умеет двигаться и прыгать, взаимодействуя со всеми физическими объектами и тримешем уровня.

Управление:
Стрелки – поворот вправо-влево и движение вперед-назад;
Пробел – прыжок.

Скачать для Windows

Исходники вскоре будут доступны в рамках проекта Atrium.