10.24
本文作者:云无心
现代技术开发出了各种各样精密的仪器,对物质的分析可以达到分子水平。但对于风味的测量,却还没有什么好的办法。在食品开发中,风味却又是至关重要的一个方面。怎么才能对一种食物的风味做出“客观”的描述呢?
“风味”的好坏是人们的主观感受。要衡量风味,自然就要以人的感受为准。但是,不同的人经常有不同的口味偏好——自己做饭自己吃的话,“我喜欢”就是黄金标准,但对于面向市场的商业化食品,“最多的人觉得好才是真的好”。
这就只能通过大量吃货的反馈来衡量。比如说,新开发一种面包,想知道消费者对它感觉如何,就找来许多消费者(通常是几十上百个),让他们吃这种新的面包和一种“参考面包”,然后分别打分。比如1最不喜欢,9最喜欢。所有人的分数平均,就是那种面包的得分。分数的高低,就可以衡量这两种面包的差距。
实际的评估比这要复杂一些。通常会把人们评价面包好坏的指标列出来,比如外观、蓬松程度、闻起来的味道、嚼起来的口感、入口的味道等等。通过这些分项的评分,可以比较出两种面包在各个方面的高下,然后有的放矢地改进。
在开发一个新产品代替旧产品的时候,目标是“以假乱真”。可以用上面所说的评分法来比较,还有一种“三角法”也很常用。“三角”的意思,就是给品尝者三个样品,一新二旧或者一旧二新,挑出不同的那个来。因为三选一蒙对的可能性也有三分之一,需要用较多的品尝者,用统计分析的工具来分析大多数人是“蒙对”还是真的能分辨。比如,100个人中有40个人选对了,选对比例是40%,乱猜也会有33.3%的比例蒙对,统计分析的结果这两个比例没有实质上的差异。也就是说,这个40%的偶然性很大,不应该认为那两种面包有明显差别。但如果100人中有45个或者更多的人选对了,就可以认为这两种面包“真的不同”。
还有一种是“排序法”,通常用于比较不同的配方或者食品制作过程。就是给品尝者几个样品,按照喜欢的程度来排序。对结果进行统计分析,就可以确定哪种制作方法更好。
这一类评估方式的好处是,代表了消费者直接的喜好。局限则是,结果受测试者饮食喜好的影响很大。比如测试豆浆,有的地区对甜的评价高,有的地区对咸的评价高。这样,测试者的代表性就非常重要。面对不同的市场,不同的人群,需要选择不同的测试者。一个地区的测试结果,在另一个地区就不一定适用。
在食品研发中,还有一些品尝评估是为了弄清成分或加工过程对风味的影响。这时候,排除个人喜好的影响、获得“客观”的数据,就非常重要。为了实现这种目标,就要进行“描述性评估”。
这种评估的过程,类似于把人当作仪器。首先,要确定评估指标。比如要评价一杯草莓饮料,可以有气味、酸味、甜味、苦味、涩味、草莓味、粘度、入口的颗粒感等等。其次,要对人进行“校准”。为每种风味找一个“标准”,比如甜味用糖、酸味用醋、苦味用咖啡因、涩味用单宁等等。每种标准配成不同的浓度 ,用来表示不同的“度”。比如2%的糖代表甜度2,5%代表甜度5,10%代表甜度10%等等。而咸味,0.2%可以用来代表2度,0.6%就该代表10度了。
把这些“仪器人”校准需要相当长的训练。每次让大家先尝标准样品,再尝未知样品,然后判断未知样品的强度。比如,如果一个样品的甜度在2和5之间,那么就根据更靠近哪边决定是3或者4。因为打分是跟自己的标准比,所以不管是喜不喜欢甜食,给出的分数都应该是3或者4。经过多次训练,大家对同一样品给出的分数相差较小时,“仪器人”就训练好了。而对那些没法设计标准样品的气味,比如某种饮料中青草的味道,就只能给一把青草闻,找到“青草味”的感觉,参考其他指标的强弱来确定强度了——比如说,刚刚能够闻到的是2,而极为强烈的是15。
校准的时候是针对每一种单一的气味或者味道。但是评估一种食品的时候,却是各种气味和味道的综合。对于评估者来说,就需要识别出每一种单一的指标,并尽量不被其他的指标所干扰。这有点象在交响乐队的演奏中,分辨出各种乐器的声音。不同的是,有些风味会互相影响,所以识别起来可能比识别乐器还要难一些。
培训“仪器人”的工作量很大,所因而这种“描述性评估”的测试者人数通常比那种“消费者评估”要少得多,十来个人也可以算比较大的样本量了。不过,因为数据的“客观性”更高,所以也可以得到有价值的数据。
在研究中,牵涉到人的实验总是费时费力。能不能用仪器来完成这些检测呢?许多仪器公司正在做这样的努力,也有一些“电子舌头”“电子鼻子”出现在市场上。它们往往也需要“培训”和“校准”,技术也还不是很成熟。目前食品行业的品尝评估,大多数还是以人为仪器来进行。或许在将来,会有仪器能够代替人,甚至更加灵敏。
暂无回复
添加回复