Какой двоичный формат используется для экспорта двоичной сетки и как его можно конвертировать в ASCII?

Вопрос или проблема

Я создал несколько больших сеток с помощью Gmsh через Python API. ASCII файлы могут занимать гигабайты. Поскольку бинарные файлы меньше по размеру и быстрее считываются, я настроил Gmsh на сохранение файлов сетки в бинарном формате. Моя текущая проблема – разобраться, как считать эту бинарную сетку обратно в Python в интерпретируемом формате.

Какое бинарное кодирование использует Gmsh для сохраненных файлов и как их можно считать обратно в Python в интерпретируемом виде.

Вот упрощенная версия кода из учебника Gmsh 1 (ссылка), модифицированная для сохранения сетки в бинарном формате.

import gmsh
import sys

gmsh.initialize(argv=["","-bin"])

gmsh.model.add("t1")

lc = 1e-2
gmsh.model.geo.addPoint(0, 0, 0, lc, 1)
gmsh.model.geo.addPoint(.1, 0, 0, lc, 2)
gmsh.model.geo.addPoint(.1, .3, 0, lc, 3)
p4 = gmsh.model.geo.addPoint(0, .3, 0, lc)

gmsh.model.geo.addLine(1, 2, 1)
gmsh.model.geo.addLine(3, 2, 2)
gmsh.model.geo.addLine(3, p4, 3)
gmsh.model.geo.addLine(4, 1, p4)

gmsh.model.geo.addCurveLoop([4, 1, -2, 3], 1)
gmsh.model.geo.addPlaneSurface([1], 1)

gmsh.model.geo.synchronize()

gmsh.model.addPhysicalGroup(1, [1, 2, 4], 5)
gmsh.model.addPhysicalGroup(2, [1], name="My surface")

gmsh.model.mesh.generate(2)
gmsh.write("t1_binary.msh")
gmsh.finalize()

Мой изначальный наивный подход заключался в том, чтобы считать файл в бинарном формате и попробовать .decode(), но этот подход не срабатывает, когда он проходит строку $Entities.

mesh_file = []
with open("t1_binary.msh", "rb") as f:
    for line in f.readlines():
        print(line)
        mesh_file.append(line.decode())

Когда он не срабатывает, я получаю ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9a in position 72: invalid start byte.

Ответ или решение

Вопрос о том, какой бинарный формат использует GMSH для экспорта сеток и как можно конвертировать их в ASCII, имеет несколько аспектов, которые необходимо рассмотреть.

Бинарный формат GMSH

GMSH использует собственный бинарный формат, называемый GMSH Binary Format, для сохранения файлов сеток. Этот формат более компактен и позволяет быстрее загружать данные в память по сравнению с текстовым (ASCII) форматом, особенно при работе с большими сетками. Бинарный формат представляет данные в виде последовательности байтов, что делает их трудночитаемыми без специальной обработки.

Чтение бинарного файла в Python

Для работы с бинарными файлами GMSH в Python, необходимо использовать библиотеку GMSH или другие подходы, так как напрямую читать и интерпретировать бинарный формат с помощью стандартных методов не получится, как это показали ваши попытки (например, использование .decode()).

Конвертация бинарного формата в ASCII

Чтобы конвертировать бинарный файл в ASCII, вы можете воспользоваться функциональностью GMSH для экспорта. Это можно сделать, выполнив команду в GMSH или используя API. Вот пример, как это можно сделать в вашем случае:

  1. Сначала загрузите бинарный файл с помощью GMSH API.
  2. Затем используйте метод gmsh.write() для сохранения сетки в формате ASCII.

Вот пример того, как это можно реализовать в вашем коде:

import gmsh

# Инициализация GMSH
gmsh.initialize()

# Загрузка бинарного файла
gmsh.open("t1_binary.msh")

# Сохранение в ASCII формате
gmsh.write("t1_ascii.msh")

# Завершение работы с GMSH
gmsh.finalize()

Вывод

Таким образом, для работы с сетками и их конвертации между бинарным и ASCII форматами в GMSH, важно использовать встроенные функции и методы API GMSH. Ваша проблема с чтением бинарного файла напрямую связана с тем, что формат байтов не предназначен для текстового чтения без предварительной обработки. Воспользуйтесь API GMSH, чтобы выполнять конвертацию и получить необходимые данные в интерпретируемом формате.

Оцените материал
Добавить комментарий

Капча загружается...