İngilizce simplified molecular input line entry specification deyiminin kısaltması olan SMILES molekül yapılarının kısa ASCII dizileri şeklinde kesin olarak tanımlanabilmesi için geliştirilmiş bir sistemdir. Çoğu kimyasal çizim programı SMILES dizilerini okuyup bunları iki boyutlu çizimlere veya üç boyutlu modellere dönüştürebilirler.

Örnekler değiştir

SMILES Notation Genel Formül Adı
C CH4 Metan
CC CH3–CH3 Etan
CCC CH3–CH2–CH3 Propan
Clc(c(Cl)c(Cl)c1C(=O)O)c(Cl)c1Cl C7HCl5O2 Penta klorobenzo asit  

Atomlar elementlerin standart kısaltmaları ile temsil edilirler, örneğin altın için [Au]. B, C, N, O, P, S, F, Cl, Br ve I@dan oluşan "organik altgrup" için köşeli parantezler kullanılmayabilir, diğer elementler için kullanılır. Eğer köşeli parantez kullanılmamışsa yeterli sayıda hidrojen atomunun bulunduğu varsayılır, örneğin su için SMILES kodu O'dur, etanol için CCO'dur.

Çift bağlı karbon dioksit O=C=O, üçlü bağlı hidrojen siyanür ise C#N olarak gösterilir.

Dallar parantezlerle gösterilir, propionik asit için CCC(=O)O ve fluoroform için C(F)(F)F (veya FC(F)F olarak da) gibi.

Sikloheksan C1CCCCC1 olarak gösterilir, burada '1 numara'nın molekülde aynı konumu işaretlediği anlaşılır, böylece 6 arbonlu bir halka oluşur. Burada kullanılan işaret numaradır (bu örnekte 1), 'C1' bileşimi değildir.

Aromatik C, O, S ve N atomları küçük harfli olarak, 'c', 'o', 's' ve 'n' olarak gösterilir. Böylece benzen c1ccccc1'dir.

İzomerler değiştir

Çift bağların etrafındaki atomların konumlarını belirtmek için "/" ve "\" karakterleri kullanılır. Örneğin F/C=C/F trans-difluoroeten'i temsil eder, F'ler çift bağın zıt taraflarındadır. F'lerin çift bağın aynı tarafında olduğu cis-difluoroeten için F/C=C\F kullanılabilir.

Eklentiler değiştir

SMILES'dan türetilmiş olan SMARTS genel arama karakteri ve bağların tanımlanmasına olanak sağlar. Kimyasal veritabanı araması yaparken aranılan yapıların tanımlanmasına yarar.